На фоне огромной популярности корейской культуры и контента − от музыки до телешоу − все больше людей стремятся выучить корейский алфавит хангыль. Этим занимаются и самые сложные в мире модели искусственного интеллекта, передает портал Asia News Network.
Сама Южная Корея, возможно, не является ключевым рынком, но, по мнению местных экспертов, потенциал хангыля и связанных с ним возможностей в сфере ИИ кажутся почти безграничными. «Корейская поп-культура и связанный с ней контент сыграл решающую роль в продвижении ценности всей корейской культуры и языка в мире, вызвав новый интерес к хангылю среди разработчиков ИИ по всему миру», − рассказал технический директор Корейской ассоциации искусственного интеллекта Ким Се Хён.
Профессор корейского языка и литературы Сеульского национального университета Пак Джи Хо также предположил, что корейские сервисы искусственного интеллекта ждут отличные перспективы. «В связи с бумом корейской культуры их поклонники по всему миру обратятся к сервисам ИИ, чтобы лучше понять хангыль», − сказал Пак.
Эксперты предсказывают, что модели искусственного интеллекта, созданные в Южной Корее, будут широко использоваться в Юго-Восточной Азии, Китае и Японии, поскольку эти страны географически ближе, а их жители - больше знакомы с корейской культурой. Тем не менее они согласны с тем, что большая часть технологического прогресса может произойти в США - крупнейшем в мире рынке ИИ. А значит, жесткая конкуренция среди разработчиков искусственного интеллекта внутри страны и за рубежом неизбежна.
Жесткая конкуренция
Все больше крупных технологических компаний инвестируют в изучение хангыля, поскольку спрос на услуги искусственного интеллекта на основе корейского языка растет. В прошлом месяце американский технологический гигант Google выбрал корейский и японский языки в качестве первых иностранных языков для своего чат-бота Bard, основанного на искусственном интеллекте, в попытке возобновить конкуренцию с ChatGPT, созданным главным соперником - компанией Microsoft. Это было неожиданным решением, учитывая то, что Южная Корея является одним из немногих рынков, где Google не является доминирующей поисковой системой. В стране с населением в 51 миллион человек доля рынка компании составляет около 30 процентов.
Немецкая компания DeepL, специализирующаяся на искусственном интеллекте, также в начале этого года запустила службу перевода на корейский язык, выбрав его в качестве 31-го языка компании и четвертого азиатского языка после китайского, японского и индонезийского. Помимо этого, компания сосредоточилась на потенциале корейского языка. «Мы получаем много запросов на поддержку корейского языка и были удивлены, увидев больший, чем ожидалось, интерес со стороны пользователей», − сказал основатель и генеральный директор DeepL Ярек Кутыловски.
Эксперты считают, что для глобальных компаний вполне естественно стремиться к расширению бизнеса в Южной Корее, основываясь на буме К-культуры. При этом специалисты по-прежнему скептически относится к тому, что такие проекты будут иметь коммерческий успех в регионе. «Корея − один из многочисленных рынков, где они предлагают услуги. Им будет сложно разработать модели искусственного интеллекта, специально предназначенные для корейского языка», − считает анонимный представитель отрасли.
Увеличение конкуренции внутри страны и ее преимущества
Корейские технологические гиганты Naver и Kakao также делают все возможное, чтобы обеспечить конкурентное преимущество перед своими соперниками. Компании разрабатывают более совершенные модели искусственного интеллекта, которые превосходят ChatGPT, когда речь идет о возможностях корейского языка.
Naver, оператор веб-портала № 1 в стране, планирует этим летом запустить свою модель искусственного интеллекта под названием HyperClova X. Компания заявила, что это будет третий в своем роде проект после тех, что используются в США и Китае, и крупнейший, специализирующийся на хангыле. HyperClova X был обучен как корейскому, так и английскому языкам, но его самое весомое преимущество − это способность лучше понимать социальный и культурный контекст. Кроме того, неоспоримым является и его лингвистическое превосходство, обеспеченное обширной базой данных, составленной Naver. «Мы возлагаем надежды на создание нашей экосистемы услуг, интегрированной с ИИ, в таких регионах, как Япония, Юго-Восточная Азия и Ближний Восток, где наши услуги на основе хангыля уже пользуются большим спросом», − сказал представитель компании.
Kakao, оператор южнокорейского мессенджера KakaoTalk, также планирует в третьем квартале этого года представить обновленную версию своей модели искусственного интеллекта на корейском языке KoGPT. Она разработана подразделением искусственного интеллекта Kakao Brain. В компании заявили, что нейросеть более эффективна и точна в общении на корейском языке по сравнению с конкурентами.
Сложный язык
Эксперты сходятся во мнении, что хангыль − сложный язык даже для моделей искусственного интеллекта из-за его грамматической структуры, которая полностью отличается от английского − наиболее распространенного языка в исследованиях ИИ.
Возможности использования корейского для глобальных моделей ИИ за последние годы значительно улучшились, благодаря таким популярным сервисам, как перевод текста, обобщение и ответы на простые вопросы. Но они все еще отстают от своих англоязычных аналогов. «Корейский язык грамматически отличается от других. Структуры предложений и выражения считаются более сложными. Кроме того, изучение языка связано с пониманием уникальной культуры и особенностей Южной Кореи», − сказал представитель Института искусственного интеллекта.
В настоящее время большинство генеративных ИИ, в основном распространенных в англоязычных странах, используют метод токенизации – это способ разбивки фрагмента текста на более мелкие единицы, называемые токенами (слова, символы). Эта система подоходит для английского языка, но не полностью применима к корейскому. «Вот почему Naver и Kakao решили разработать свои собственные методы обмена токенами, подходящие для корейских морфем, чтобы преодолеть эти ограничения», − отметил профессор Сеульского национального универститета Пак. «Крайне важно полностью понимать характеристики языка для разработки новой модели ИИ, не говоря уже о корейском языке, в котором много неправильных предикативных элементов», − добавил профессор. «Я надеюсь, что местные фирмы смогут разработать улучшенную модель искусственного интеллекта на корейском языке, чтобы ею можно было поделиться с другими фирмами, не говорящими по-корейски».
Страны региона уже активно вовлечены в работу различных региональных институтов и получают от этого экономические и политические дивиденды.
Для реализации проекта потребуется серьезная государственная поддержка.
Развитие действующих и создание новых торговых путей обеспечит кооперирование и интеграцию стран региона, что приведет к устойчивому экономическому развитию государств ЕАЭС и ШОС.
Система позволяет получать патенты на разработки сразу в 8 евразийских странах – Азербайджане, Армении, Беларуси, Казахстане, Кыргызстане, России, Таджикистане и Туркменистане.