DAILY MAIL И CNN ПОМОГЛИ ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ НАУЧИТЬСЯ ЧИТАТЬ
Команда специалистов по глубокому машинному обучению из Google DeepMind и Оксфордского университета обучила искусственный интеллект читать тексты и отвечать на вопросы о содержании прочитанного. В этом им «нечаянно» помогли вебсайты Daily Mail и CNN, открывшие доступ к огромному архиву своих новостей. С результатами работы можно ознакомиться в препринте на сайте Корнельского университета.
В настоящий момент глубокое обучение нейросетей, особенно связанное с распознаванием разного рода изображений, переживает настоящий расцвет. Он, в первую очередь, связан с возможностью собирать гигантские базы данных и статистику, необходимые для тренировки нейросетей. Благодаря всевозможным онлайн-сервисам, где энтузиасты или простые пользователи помогают за сжатые сроки собрать такие базы данных (например, с изображением птиц), или накопить статистику ошибок и корректировок (как в случае с определением возраста), возможности искусственного интеллекта в этих сферах вышли на совершенно новый уровень. Однако такая элементарная для человека задача как чтение и понимание текста до сих пор остается для компьютеров непосильной.
Главная проблема – отсутствие хорошо аннотированных баз структурированных текстов для тренировки и обучения. Они должны включать в себя как тексты для чтения, так и специальные описания его ключевых моментов и структуры, причем сделанных таким образом, чтобы словесные последовательности из описания не встречались в самом тексте. Иными словами, чтобы искусственный интеллект смог отвечать на вопросы по тексту, он должен ориентироваться не на частоту появления тех или иных слов и их сочетаний, а на грамматические и причинно-следственные связи внутри него. До недавнего времени создать такую базу могли только высокооплачиваемые специалисты-редакторы, что вело либо к тому, что базы были недостаточные по размерам для обучения, либо достижение необходимой полноты обошлось бы в совершенно баснословные деньги. Однако недавно ученые нашли выход из этой ситуации.
Читать далее: https://nplus1.ru/news/2015/06/19/newsroom