Про японські детективи, математичні задачі та штучний інтелект

Читав я оце роман Кейґо Хіґасіно «Відданість підозрюваного Х». Змалечку полюбляю детективи. Одна з «родзинок» — фабула, побудована навколо проблеми рівності класів «P» і «NP». Це одна з семи «задач тисячоліття», за розв’язання призначена премія в мільйон доларів. Дивіться: є задачі, розв’язати які можна швидко (Р). Є інші, які ми поки що вміємо розв’язувати лише довго, але коли знаємо розв’язок, то перевірити, чи він правильний, можемо швидко (NP). Проблема рівності класів така: чи існують задачі, де перевірити правильність розв’язку можна швидко, а ось розв’язати швидко — принципово ні? Скажімо, в 1955 році Джон Неш припустив, що така задача існує. А саме, можна швидко перевірити, чи правильно розшифрований текст, маючи ключ; а от швидко розшифрувати, не маючи ключа, неможливо. От тільки чи таки неможливо, не довели й досі.

Редактори розв’язують подібну проблему щодня: що швидше — довести до пуття чужий переклад чи зробити власний «з чистого аркуша»? Адже є перекладачі, чий переклад можна поліпшити відносно малими зусиллями, а є й такі, чий переклад довести до пуття — майже нерозв’язна проблема: куди швидше й легше перекласти самому.

Сподіваюся, я не самотній в думці, що комп’ютерні програми належать до другого різновиду перекладачів. Зараз імовірнісні генератори текстів, звані в рекламі «штучним інтелектом», уже пишуть не кострубаті, а гладенькі, прилизані тексти. От їхню продукцію і публікують без постредагування.

Навчання ШІ вимагає величезних масивів текстів, і єдина можливість їх створювати — масове завантаження з Інтернету. Відбувається «отруєння рекурсією»: сенсу меншає, галюцинацій більшає. Це підтверджено експериментально: 6,38 мільярдів речень дослідили на наявність «багатооборотного паралелізму» —коли кілька речень є перекладом одне одного на три і більше мов. Виявилося, що більшість опублікованого в Інтернеті — переклад: 57,1 % речень існували паралельно на трьох і більше мовах.

Що більше паралелізм, то гірші тексти: англійська чи французька мають цей показник у районі 4, тоді як, скажімо, мови волоф чи коса — майже 9. Тобто найгірше в мовах «малоресурсних», де текстів для навчання ШІ бракує. Українську автори не досліджували, але вона належить до цієї ж категорії.

Укотре закликаю: бережіть майстерних перекладачів!

Картинку, хто б сумнівався, намалював «штучний інтелект».

Залишити коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.

Прокрутка до верху