PaLI-3 Vision Language Models: Smaller, Faster, Stronger

https://devfeature-collection.sl.nsw.gov.au/record/TN_cdi_proquest_journals_2878323455

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

About this item

Full title

Author / Creator

Chen, Xi , Wang, Xiao , Beyer, Lucas , Kolesnikov, Alexander , Wu, Jialin , Voigtlaender, Paul , Mustafa, Basil , Goodman, Sebastian , Ibrahim Alabdulmohsin , Padlewski, Piotr , Salz, Daniel , Xiong, Xi , Vlasic, Daniel , Pavetic, Filip , Rong, Keran , Yu, Tianli , Keysers, Daniel , Zhai, Xiaohua and Soricut, Radu

Publisher

Ithaca: Cornell University Library, arXiv.org

Journal title

arXiv.org, 2023-10

Language

English

Formats

Articles

Publication information

Publisher

Ithaca: Cornell University Library, arXiv.org

Subjects

Subjects and topics

More information

Scope and Contents

Contents

This paper presents PaLI-3, a smaller, faster, and stronger vision language model (VLM) that compares favorably to similar models that are 10x larger. As part of arriving at this strong performance, we compare Vision Transformer (ViT) models pretrained using classification objectives to contrastively (SigLIP) pretrained ones. We find that, while sl...

Alternative Titles

Full title

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

Authors, Artists and Contributors

Author / Creator

Chen, Xi
Wang, Xiao
Beyer, Lucas
Kolesnikov, Alexander
Wu, Jialin
Voigtlaender, Paul
Mustafa, Basil
Goodman, Sebastian
Ibrahim Alabdulmohsin
Padlewski, Piotr
Salz, Daniel
Xiong, Xi
Vlasic, Daniel
Pavetic, Filip
Rong, Keran
Yu, Tianli
Keysers, Daniel
Zhai, Xiaohua
Soricut, Radu

Identifiers

Primary Identifiers

Record Identifier

TN_cdi_proquest_journals_2878323455

Permalink

https://devfeature-collection.sl.nsw.gov.au/record/TN_cdi_proquest_journals_2878323455

Other Identifiers

E-ISSN

2331-8422

How to access this item

Full text available

View in old catalogue

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

PaLI-3 Vision Language Models: Smaller, Faster, Stronger

About this item

Publication information

Subjects

More information

Scope and Contents

Alternative Titles

Authors, Artists and Contributors

Identifiers

Primary Identifiers

Other Identifiers

How to access this item

Connecting people and collections

Indigenous engagement

Learning

Stories