Latam GPT — первая латиноамериканская языковая модель

Президент Чили Габриэль Борич во вторник присутствовал на презентации «Latam GPT», первой крупномасштабной языковой модели, разработанной совместно странами региона в целях содействия технологическому суверенитету Латинской Америки и Карибского бассейна.

«Мы позиционируем регион как активного и суверенного игрока в экономике будущего», — отметил президент на презентации.

Эта инициатива — первая модель открытого языка в Латинской Америке и Карибском бассейне, содержащая около 230 миллиардов слов и идентифицирующая себя с помощью информации, поступающей с континента.

Это предложение удалось сформулировать различным государствам, академиям, государственным учреждениям и международным организациям, таким как Банк развития Латинской Америки и Карибского бассейна (CAF), в дополнение к технологическим услугам, среди прочего.

«Благодаря этому все больше латиноамериканцев смогут понять, как работает искусственный интеллект (ИИ), будет больше научной специализации, улучшится инфраструктура, появятся сотрудничества, которых раньше не было, и мы также можем иметь наш собственный критический и позитивный взгляд на эту технологию», — заявил Борич во время церемонии, проходившей в Чили.

Он подчеркнул связь, которая в настоящее время существует между языком и искусственным интеллектом, а также важность возможности выражать культуру с помощью технологий.

Это языковая модель большого размера (LLM), имеющая открытую структуру.

Она была разработана в рамках многосторонних партнерских отношений и способствует совместному этическому управлению при координации Национального центра искусственного интеллекта (Cenia) Чили и совместно продвигается учреждениями от Мексики до южной части континента.

Модель была обучена местным текстам, документам, данным и голосам на испанском и португальском языках, а также на языках коренных народов.

«Некоторые могут подумать, что создание языкового генератора из Латинской Америки — дело гиков, но это не так. Здесь мы защищаем нашу идентичность. Мы защищаем наше право на существование», — добавил президент Чили в своем выступлении.

По словам специалистов, современные языковые модели искусственного интеллекта, создаваемые в основном в Северном полушарии, построены на основе обучающих данных, которые не обязательно отражают культуру, язык и история Латинской Америки и Карибского бассейна.

В этой связи директор Cenia Альваро Сото заявил на презентации, что Latam-GPT «позволяет Латинской Америке участвовать в революции искусственного интеллекта в качестве действующего лица, развивая собственные технологии и демонстрируя, что это возможно, когда регион работает вместе».

Он отметил, что это приложение предназначено в качестве открытой технологической базы для разработки производных моделей, адаптированных к различным региональным контекстам.

«Таким образом, регион является не только пользователем ИИ, но и может создавать собственные решения на основе общих возможностей», — добавил он.

Из Cenia они подчеркнули, что, в отличие от моделей, обученных в основном с использованием информации на английском языке и культурных структур Глобального Севера, Latam-GPT понимает культурные, языковые нюансы и исторические и политические контексты Латинской Америки, разработанные исследователями, учеными и профессионалами в регионе.