Лексика східного походження: зауваги й пропозиції

11 і 12 листопада Міжнародна наукова конференція «Лексика східного походження в українській мові. Теоретичні й прикладні аспекти відображення власних і загальних назв» вперше залучила до обговорення практичної транскрипції фахівців зі східних мов, загального мовознавства та української мови.

Частина перша: мій звіт в цитатах і коментарях.

Далі частина друга: мої зауваги й пропозиції.

Зауваги й пропозиції: (1) експеримент з програмами перетворення тексту в мову та мови в текст; (2) вимірювання фонетичних відстаней

З моєї промови:

«Ще один аргумент [на користь зміни транскрипції — І.Д.], до якого вдавалися неприсутні на сьогоднішній конференції фахівці, — це сприйняття японцями того, як українці вимовляють ті чи інші японські слова. Маю зазначити що тут не враховано психолінгвістичний аспект. Техніка дозволяє нам поставити чистий експеримент. Добрана у відповідний спосіб сукупність японських має бути записана українською мовою в різних варіантах транскрипції. Програма перетворення українського тексту в мову згенерує звукові файли. Далі ці звукові файли передаються на вхід програми розпізнавання японської мови. Ми побачимо, як ця програма розпізнаватиме згенеровані звуки як ті чи інші японські слова. А обробивши статистично результати, зможемо судити про те, наскільки та чи інша транскрипція впливає на сприйняття як японських прочитаних українською мовою слів. Хоча маю зазначити, до практичної транскрипції це зовсім не має стосунку. Це просто може бути задоволення чиєїсь наукової цікавості».

Я, звісно, відразу поставив такий експеримент — буквально на кілька слів, не претендуючи ні на строгість, ні на достатність, ні на об’єктивність, бо використав лише по одній програмі кожного типу (https://speechgen.io/en/tts-ukrainian/ та https://elevenlabs.io/app/speech-to-text), а їм можуть бути притаманні систематичні недоліки.

Подовження за Т. Дементьєвою: шкідливе — „шюу“ після „юу“ хибно розпізнається як „дзю:“ (двокрапка позначає подовження), а „чюу“ — як „сю:“. „Ші“ замість „сі“: непотрібне, розпізнаються однаково. Цікаво, що склади у варіанті українською без подовження розпізнаються як подовжені.

„Г“ замість „х“ за О. Забуранною: непотрібне, „ха“ і „га“ розпізнаються однаково. „Ші“ замість „сі“: непотрібне, розпізнаються однаково.

„Чі“ або „ці“ замість „ті“: непотрібні, розпізнаються однаково.

Відображення редукції „і“ між глухими: шкідливе — і „сь“, і „шь“ розпізнаються як „су“.

„И“ замість „у“ (моє припущення): незрозуміло — обидва варіанти розпізнаються хибно, але по-різному, а саме, „су“ як „со“, а „си“ як „са“; або непотрібно —„ку“ і „ки“ однаково розпізнані як „ку“.

„Ші“ замість „хі“ (моє припущення): непотрібно, розпізнаються однаково.

„Ло“ або „льо“ замість „ро“ (моя пропозиція): непотрібно, розпізнаються однаково. Цікаво, що цей склад скрізь розпізнався як довгий.

Вийшла б курсова робота, але певен, що в жодному ЗВО не знайдеться викладача, який ризикнув би дати студентові тему, де результат не просто не відомий наперед, а може поставити під сумнів роками впроваджувану реформу транскрипції.

Ольга Сілівра — коментар до доповіді Максима Вакуленка про розрахунок фонетичних відстаней

«Ви в своїй роботі вказуєте, що українські шиплячі приголосні взагалі не можуть бути палаталізованими. Але якби ми не вказували йому („шь“ — І.Д.) палаталізацію в іншому параметрі, це передбачало б, що він звучить фактично не як „шь“, а як „ш“. А все-таки ніхто тут не буде стверджувати, що не чує різницю між словами “шинка“ і „шість“. Більш того, я навіть подивилася на спектрограми, і спектрограма звука „шь“ пом’якшеного українського відрізняється від спектрограми звука „ш“ непом’якшеного українського. От тому я вирішила вказати йому палаталізацію як 7/8, тобто посередній між 3/4 і 1».

Йдеться про розрахунок фонетичної відстані як кореня квадратного з суми квадратів різниць значень відповідних параметрів. Само собою, відстань між палаталізованим і непалаталізованим звуками буде більшою (тут різниця значень параметра „палаталізація“ найбільша, бо від’ємник дорівнює нулю), ніж між двома різною мірою палаталізованими (різниця менша, бо від’ємник ненульовий). От тільки палаталізації шиплячих в українській немає, і тому додавати цей параметр у розрахунок, — очевидна помилка.

Можливий шлях, відомий принаймні з 1970-х років: за фоноспектрограмами визначити, який саме фізичний параметр (або величина, розрахована за кількома доведено незалежними параметрами) відрізняє палаталізований японський звук від непалаталізованого пом’якшеного шиплячого українського; так само від м’якого зубного українського; далі знайти в експерименті граничне значення цього параметра, при якому ще можливе розрізнення; звідси виснувати, що ближче. Можна розраховувати фонетичні відстані за кількісними фізичними величинами, а не якісними артикуляційними, де доводиться впроваджувати вагові коефіцієнти, довільний вибір яких зводить нанівець строгість результатів. Але ці величини треба спершу визначити чи знайти в літературі. Проте нагадаю вкотре, що для практичної транскрипції близькість до оригінальної мови другорядна.

Лексика східного походження: зауваги й пропозиції

Схожі дописи

Залишити коментар Скасувати відповідь