Машинное обучение (Machine Learning) в Армении и в диаспоре – развитие и потенциал

Буквально несколько лет назад понятие искусственного интеллекта было известно узкому кругу специалистов, их можно было сосчитать на пальцах. Но в последние пять лет сектор активно развивается, а кадровый потенциал возрастает. Такая же картина наблюдается в достаточно развитой технологической стране южно-кавказского региона – Армении. Именно нынешний год стал значимым для государства ввиду активизации сообществ и открытия специальных центров для развития молодых специалистов и создания материально-технической базы.

Машинное обучение в Армении – нынешнее состояние сектора

Мысли о развитии сектора машинного обучения (Machine Learning) в Армении зародились в 2019 году с идеей создания центра искусственного интеллекта в Ереване («центр мастерства»).

Такая идея упоминается в предварительной версии Стратегического документа, разработанного министерством индустрии высоких технологий, в стратегии Фонда FAST, в документах, подготовленных Американским университетом и AGBU, упомянуто в программе ATOM, инициированной президентом Арменом Саркисяном, а также в других частных инициативах.

Независимо от того, чем будет заниматься созданный центр, главное сосредоточие базируется на теоретических исследованиях или приложениях в других областях (таких, как медицина), а также на распределении времени между образовательными и исследовательскими компонентами. Однако работа такого центра требует, прежде всего, специалистов:

  • профессоров соответствующей квалификации;
  • исследователей;
  • аспирантов.

В этой статье мы попытаемся понять, какие исследовательские и образовательные ресурсы мы имеем в Армении для развития машинного обучения, и особенно за ее пределами.

Одним из лучших способов найти профессионалов, работающих в любой области, является исследование ведущих конференций и авторов высококачественных журналов, а также навигация по веб-сайту Google Scholar.

Машинное обучение в Армении – конференции и научные статьи

В первую очередь рассмотрим машинное обучение в Армении как развивающееся направление на примере проведенных мероприятий и опубликованных исследовательских работ.

Так, конференция NeurIPS 2019, которая состоялась 8-14 декабря в Ванкувере (Канада), является наиболее важным мероприятием в области машинного обучения Армении. В этом году была представлена одна работа с армянским соавтором, а также работа Микаела Самвеляна с партнерами из Оксфордского университета.

Микаел Самвелян также представил poster на семинаре DeepRL в дополнение к этой конференции. В настоящее время он является аспирантом в Армяно-российском университете, в скором времени защитит свою докторскую диссертацию в Профессиональном совете Института проблем информатики и автоматизации НАН.

Работа посвящена усиленному обучению (reinforcement learning) и включает в себя семинары с партнером в Оксфорде.

В свою очередь, Грайр Арутюнян, аспирант Университета Южной Калифорнии, стал соавтором статьи на NeurIPS’19. Он представил другой poster на семинаре, посвященном вопросам теории информации.

Автором двух статей в NeurIPS’19 является Арам Галстян, руководитель отдела искусственного интеллекта Института информационных систем Университета Южной Калифорнии (ISI). Последние десять лет он работал с многочисленными учеными и студентами, работающими в Армении.

В результате этих работ были опубликованы статьи Армена Аллахвердяна, научного сотрудника Ереванского физического института (более десяти статей с 2009 года), студента факультета информатики ЕГУ Ваге Мусояна (2008), YerevaNN (три статьи с 2017 года) и НАС Molecule (с 2019). Выпускники Ереванского государственного университета Шушан Аракелян и Грайр Арутюнян входят в число аспирантов группы Арама Галстяна.

Анна Арутюнян, исследователь DeepMind, постоянно публикуется на крупных конференциях в этой области:

  • NeurIPS’19;
  • ICML’19;
  • AAAI’18.

Она также была одним из региональных председателей конференции ICML’19, то есть отвечала за обзор статей по определенной теме. Анна Арутюнян в последние годы помогает организовать Глобальный инновационный форум FAST.

Одна из статей на NeurIPS’19 была представлена аспирантом Московского технологического университета Ваге Егиазаряном и аспирантом Корнелльского университета Евгением Багдасаряном.

Год назад в NeurIPS’18 вышла статья постдока Стэнфордского университета Вардана Папяна. До переезда в Стэнфорд он получил докторскую степень в Израильском технологическом университете.

В этих конференциях ученые участвуют не только как авторы, но и как рецензенты. Список рецензентов для конференции NeurIPS публикуется. Арнак Далалян, профессор Парижского университета ENSAE и исследовательского центра CREST, находится в этом списке. Он был региональным председателем на конференции NeurIPS в течение нескольких лет.

Рассматривая машинное обучение в Армении, стоит отметить возможность обучения новых специалистов. Например, Арнак Далалян преподает в Американском университете Армении в течение семестра и регулярно работает со студентами в армянских университетах. В настоящее время руководит кандидатской диссертацией аспиранта механико-математическом факультете ЕГУ, сотрудника YerevaNN Аршака Минасяна.

Также в списке обзора NeurIPS’19 Месроп Оганесян из Иллинойского университета в Чикаго. Он также регулярно публикуется на конференциях NeurIPS и COLT, участвовал в конференции FAST/NSF Machine Learning for Discovery Sciences (2017).

Вторая наиболее престижная конференция по машинному обучению – ICML. В статьях ICML 2018 и 2019 годов уже упоминались Грайр Арутюнян, Михаил Самвелян, Анна Арутюнян, Арам Галстян. Другим автором статьи был Эдгар Минасян, аспирант Принстонского университета.

Машинное обучение в Армении – смежные области

В последние годы машинное обучение в Армении начало охватывать ряд смежных областей. Конференции по распознаванию изображений и текста стали настолько перегружены статьями, использующими методы машинного обучения, что, например, на одной из крупнейших конференций по компьютерной лингвистике участники жаловались на то, что на конференции почти не встречались лингвисты, все они были специалистами именно в области механического обучения.

Таким образом, можно сделать вывод – многие исследователи в области компьютерного зрения и развития естественного языка начинают практиковать методы машинного обучения во всем мире и в Армении, поэтому специалистов в этой сфере можно найти на тематических конференциях.

Крупнейшие конференции по распознаванию изображений – это CVPR и ICCV. В Ереване у SuperAnnotate.ai был отдельный стенд на выставке CVPR’19. Ваан Петросян, соучредитель компании, учился в университете KTH в Швеции и был опубликован, например, на конференции AAAI. Представители IntelinAir также присутствовали на CVPR’19 из Армении. На конференции не было ни одного автора статьи из Армении.

Одна статья в CVPR’19 и ICCV’19 была представлена Арменом Аветисяном, аспирантом Технического университета Мюнхена. Он занимается проблемами компьютерного (технического) зрения для 3D-моделей.

Соавтором статьи на CVPR’19 был аспирант Кембриджского университета Айк Сарибекян, который был вовлечен в компьютерное зрение в течение лет, проведенных в MIT. Аспирант Цюрихского университета ETH Мартин Данелян регулярно публикуется в CVPR и ICCV.

Карен Егиазарян, профессор Финского университета Тампере, регулярно публикуется в лучших компьютерных журналах. Она также старается поддерживать связь со студентами из Армении, регулярно наблюдая и контролируя их работу.

На сайте Google Scholar есть возможность видеть всех сотрудников исследований.

Основными конференциями в области развития естественного языка являются ACL, EMNLP и NAACL. Эта область удивительно централизована. Почти все документы и журналы конференции собраны в одной базе данных ACL Anthology. Также отметим:

  • две работы от YerevaNN были представлены на семинарах в рамках EMNLP’18 и ACL’19 из Армении;
  • Армен Агаджанян, сотрудник Facebook, представил статью в ACL’19. Он переехал из Армении в раннем возрасте;
  • Ваге Читоян, постдок из Университета Беркли, проделал интересную работу в области материаловедения, но теперь перешел на Google;
  • Лана Яганова, сотрудник NIH США, проделала большую работу по анализу биомедицинских текстов. Она была опубликована как в EMNLP, так и в более узких профессиональных мастерских. Лана Яганова регулярно посещает Армению и участвует в конференциях и летних школах;
  • на семинарах, приуроченных к конференции ACL, был опубликован Вачаган Кратян, магистр гуманитарных наук из Штутгартского университета.

Машинное обучение в Армении – исторический обзор

Изучение истории развития науки и машинного обучения в Армении показывает, что почти все научные школы были созданы и работают с армянскими учеными, работающими в других странах.

Известно, что Акоп Манандян вернулся в страну по приглашению Геворкской семинарии Эчмиадзина, получил ученую степень в Германии, а затем работал в различных европейских исследовательских центрах.

Манандян занимал различные должности в Ереванском государственном университете, преподавал здесь, оставил огромное научное наследие в области истории.

Ереванский физический институт, который является основой «великой физики» в Армении, был основан братьями Алиханянами. Абрахам Алиханян учился в Ленинградском политехническом институте, затем работал в Ленинградском физико-техническом институте, позже основал и возглавил Институт теоретической и экспериментальной физики в Москве (ныне названный его именем).

Таким образом, находясь в России, он внес большой вклад в развитие физики и машинного обучения в Армении. Проработав 14 лет в Ленинграде, его брат Артем Алиханян переехал в Армению и 30 лет возглавлял Ереванский физический институт. Физики старшего поколения говорят, что участие неармянских физиков сыграло важную роль в развитии EрФИ.

Машинное обучение в Армении – это постепенное движение в развитии. Например, в 2016 году после апрельской войны в Армении было начато исследование беспилотников. Наира Овакимян, профессор из Университета Иллинойса в Урбана-Шампейн, создала лабораторию по этой теме. По ее предложению, в 2018 году в Национальном университете робототехники Армении была создана лаборатория авиационной робототехники.

Однако результаты лабораторных работ еще не достигли международных площадок. Одна из ключевых причин заключается в том, что компания все еще может инвестировать в создание и оснащение лаборатории, вкладывая при этом соответствующие человеческие ресурсы и обеспечивая конкурентные условия труда. Подобная проблема может вскоре возникнуть на суперкомпьютере, полученном от NAS во французском университете.

Машинное обучение в Армении – планы на будущее

Опыт показывает, что инвестиции в развитие машинного обучения в Армении, в основном, расходуются на улучшение условий строительства и приобретение оборудования, хотя именно техническая база не является особо дорогой.

Конечно, есть некоторые исследовательские проблемы, которые требуют дорогих суперкомпьютеров, но даже без вычислительных ресурсов можно проводить исследования мирового уровня.

Чтобы добиться успеха в области машинного обучения в Армении, произвольные инвестиции в строительство и оборудование должны сочетаться с увеличенными инвестициями именно в человеческие ресурсы.

Делаем выводы:

  1. Каждый аспирант, упомянутый в этой статье, должен иметь 3-4 предложения о работе из армянских учреждений на момент завершения. Многие не сразу примут эти предложения, так как зачастую интереснее оказывается другой постдок в ведущих лабораториях. В любом случае профессионалы, работающие в этой области, всегда должны иметь возможность переехать в Армению и продолжить свои исследования здесь, работая с местными студентами.

Конкурентоспособность рабочих мест, как подробно обсуждалось на октябрьской конференции STCC, в основном состоит из двух компонентов: кто будет партнерами (с кем будут работать другие профессора), и какие условия труда будут предоставлены (объемы обучения, зарплата, медицинское страхование и т. д.). Институты, по крайней мере, в области машинного обучения в Армении, не конкурируют с первым компонентом, что дает ему неуязвимость.  

YerevaNN стремится предоставить одно из этих предложений в ближайшие годы.

Не все студенты хотят переехать в другие страны для обучения в аспирантуре. Должны быть разработаны механизмы, способствующие реализации программ последипломного образования в Армении. В настоящее время машинное обучение в Армении сталкивается с главной проблемой – здесь нет научных лидеров высокого уровня.

Однако даже в этих условиях в ближайшие 1-1,5 года в Армении будут поддержаны три докторские диссертации по машинному обучению. Во всех трех случаях работа фактически выполнялась под руководством профессоров за рубежом. Эту систему необходимо формализовать и разработать специальную систему финансирования.

  1. Университеты должны начать специальные докторские программы под руководством ученых за рубежом (не только армян).

Во-первых, важно установить высокую стипендию для аспирантов, чтобы студент не работал в промышленности, а мог сосредоточиться на своей докторской работе. Средства также должны быть выделены аспиранту на 2-3 месяца в год (согласно гранту FAST Foundation) и руководителю, чтобы провести как можно больше времени в Армении. Введение новых курсов с помощью научного руководителя может быть частью программы последипломного образования по машинному обучению в университете Армении.

Если эта схема будет работать успешно, можно будет привлечь и аспирантов из соседних стран. Аналогичный механизм в настоящее время действует в Институте проблем информатики и автоматизации при Институте Тулузы.

Пригласить ученых и профессоров в Армению на длительное время крайне сложно, практически невозможно. Американский университет Армении имеет опыт приглашения преподавателей в академический отпуск (творческий отпуск) в Армению на семестр. Этот механизм необходимо усовершенствовать и расширить, чтобы максимизировать долгосрочные выгоды. В ходе обсуждения, организованного в рамках мероприятия FAST GIF’19, Арнак Далалян предложил следующий механизм привлечения профессоров:

  1. Должны быть объявлены долгосрочные (пятилетние) исследовательские гранты для формирования научных групп. Руководитель группы – профессор из зарубежного института, который обязуется проводить в Армении 1-2 месяца в год. В группу также входят 2-3 ученых, которые постоянно проживают в Армении и становятся ядром созданной лаборатории. Грант также предусматривает постдипломные посты, создание новой образовательной программы. Один такой грант будет стоить 100-200 тысяч долларов США в год.

Выполнение этих шагов поможет сделать дискуссии по созданию центров искусственного интеллекта более актуальными. Без привлечения соответствующих специалистов центры машинного обучения в Армении не могут быть конкурентоспособными на международных площадках.

Остались вопросы? Задайте их нашим специалистам по электронной почте info@offshore-pro.info.

Нужна консультация?

Читайте другие интересные статьи портала InternationalWealth.info:

Помогите сделать наш портал еще детальней, актуальней и полезней для Вас и Вашего бизнеса.

Адрес вашей почты не будет опубликован.