Транскриптор
1. Алфавит
Польский алфавит построен на основе латиницы с диакритическими знаками (ą, ć, ę, ł, ń, ó, ś, ź, ż) и буквосочетаниями для обозначения отдельных звуков (ch, cz, dz, dź, dż, rz, sz, szcz).
2. Транслитерация
Большинство букв и буквосочетаний передаются на русский язык однозначно:
b | → б | d | → д | h | → х | ń | → нь | szcz | → щ | ||||
c | → ц | dz | → дз | k | → к | p | → п | t | → т | ||||
ć | → ць | dż | → дж | ł | → л | r | → р | w | → в | ||||
ch | → х | f | → ф | m | → м | s | → с | z | → з | ||||
cz | → ч | g | → г | n | → н | sz | → ш | ż | → ж |
3.
Контекстные правила для гласных
В начале слова e → э, иначе e → е: Eugeniusz → Эугенюш.
Буквы ą и ę обозначают носовые гласные звуки и передаются на русский так же, как и сочетания вида простая гласная (o и e соответственно) + носовая согласная (m перед b или p, иначе n). Например: Dębicki → Дембицкий, Bądkowo → Бондково. В начале слова эти буквы не встречаются.
Перед гласной i служит для обозначения мягкости предшествующего согласного, поэтому ia → я, ie → е, io → ё, ió (iu) → ю.
4. J
Сочетания j с гласными передаются в транскрипции следующим образом:
—в начале слова ja → я, je → е, jo → йо, jó (ju) → ю;
—после гласной ja → я, je → е, jo → ё, jó (ju) → ю;
—после согласной ja → ья, je → ье, jo → ьо, jó (ju) → ью.
Перед согласными и в конце слова j → й: Andrzej → Анджей.
5. Y
После шипящих согласных (cz, rz, sz, szcz, ż) действует правило y → и, в остальных случаях y → ы.
В личных именах в середине слова y → и не только после шипящих, а в конце личных имен y → ий: Krystyna → Кристина, Walenty → Валентий.
«Транскриптор» не делает исключений для неизвестных ему личных имен.
6. Контекстные правила для согласных
После глухих согласных (ch, k, p, t) и перед ними rz → ш, в остальных случаях rz → ж.
Перед согласными ć, l, ń, dź, ś, ź и перед другими согласными, за которыми следует i: dź → дз, ś → с, ź → з. В остальных случаях dź → дзь, ś → сь, ź → зь.
Мягкость звука l показывается в транскрипции с помощью следующей гласной (la → ля, le → ле, li → ли, lo → лё, ló (lu) → лю), а на конце слова или перед согласной — мягким знаком: Emil → Эмиль, Lacaz → Ляцаз.
7. Окончания фамилий
В русском языке принято передавать окончания польских фамилий таким образом:
-ski / -ska | → -ский / -ская |
-cki / -cka | → -цкий / -цкая |
-dzki / -dzka | → -дский (-дзский) / -дская (-дзская) |
Транслитерация русского и немецкого языков онлайн: имена, фамилии, буквы
На данной странице вы найдете правила и таблицу транслитерации букв русского и немецкого алфавита, а также сможете выполнить автоматический перевод нужных вам имен и фамилий или других имен собственных с немецкого на русский или с русского на немецкий язык.
§ Транслитерация имен, фамилий, букв с русского на немецкий и с немецкого на русский язык
Что такое транслитерация? Это передача букв одного алфавита соответствующими буквами другого алфавита. Транскрипция в принципе тоже самое, но с учетом произношения букв другого алфавита. Если при транслитерации могут использоваться диакритические знаки и другие обозначения и символы, то при транскрипции обычно используются только буквы целевого алфавита. Транслитерация используется для передачи имен, фамилий и различных названий, которые должны быть переданы буквами другого алфавита, без передачи смысла слова; в Германии является особенно востребованной при переводе личных документов с русского на немецкий язык или с немецкого на русский язык для передачи фамилии, имени и отчества, а также географических названий и других имен собственных.
§ Популярные системы транслитерации русского языка в латинский, немецкий, английский.
Для передачи букв одного алфавита в другой используются разные системы транслитерации и транскрипции. Некоторые из них установлены официальными организациями и применяются при транскрипции данных из личных документов.
Самые широко используемые системы транслитерации, применяемые в настоящее время в мире для передачи с русского языка на латинский, немецкий и английский, представлены далее на странице. Непосредственные соответствия букв смотрите ниже на странице в разделе таблицы транслитерации
ISO-9 (1995) | Международная система транслитерации кириллических алфавитов на латиницу, с однозначным соответствием букв и использованием диакритических знаков. |
---|---|
DIN 1460 | Система транслитерации русского языка Немецкого института по стандартизации, адаптированная к немецкому языку система ISO-9 |
МИД России, N 4271 | Транслитерация кириллических знаков, рекомендуемая для использования государствами. (Приложение N 7 к Административному регламенту Министерства иностранных дел Российской Федерации по предоставлению государственной услуги по оформлению и выдаче паспорта гражданина Российской Федерации, удостоверяющего личность гражданина Российской Федерации за пределами территории Российской Федерации, утвержденному приказом МИД России от 29 марта 2016 г. N 4271) |
Ген. конс. РФ Бонн (2013) | Правила транслитерации имён и фамилий для перевода документов, от консульства РФ в Бонне |
Duden | Транскрипция от Издательства библиографического института Duden |
Английский язык | Транслитерация русского языка в английский язык. Русские буквы «е» и «ё» обычно передаются как английская «e», однако в начале слова, после гласных и после букв «й», «ь», «ъ» передаются как «ye». |
§ Автоматическая транслитерация имен, фамилий, букв, а также любого текста с русского на немецкий и с немецкого на русский язык
В следующей далее форме вы можете сделать автоматическую транслитерацию русского текста (не более 1000 символов), выбрав нужную вам систему транслитерации. Замена букв происходит в согласии с таблицей транслитерации русского алфавита или таблицей транслитерации немецкого алфавита, в зависимости от вашего выбора. При транслитерации не учитываются правила подстановки, касающиеся расположения букв и сочетания букв в словах.
§ Таблицы транслитерации букв русского алфавита
В таблице 2 представлены правила транслитерации букв русского и немецкого алфавита, а также сочетаний букв по системам транслитерации ISO-9, DIN 1460, МИД России 4271, Duden и другим, описанным выше на странице.
Таблица 2: Транслитерация букв русского алфавита
Русский алфавит | ISO-9 (1995) | DIN 1460 | МИД России, N 4271 | Ген. конс. РФ Бонн (2013) | Duden | Анлийский язык |
---|---|---|---|---|---|---|
а | a | a | a | a | a | a |
б | b | b | b | b | b | b |
в | v | v | v | w,v | w | v |
г | g | g | g | g | g | g |
д | d | d | d | d | d | d |
е | e | e | e | e,ä | e,je | e,ye |
ё | ë | ë | e | jo,ö | jo | e,ye |
ж | ž | ž | zh | zh | sch | zh |
з | z | z | z | z,s | s | z |
и | i | i | i | i,ie | i | i |
й | j | j | i | j | j | y |
к | k | k | k | k | k | k |
л | l | l | l | l | l | l |
м | m | m | m | m | m | m |
н | n | n | n | n | n | n |
о | o | o | o | o | o | o |
п | p | p | p | p | p | p |
р | r | r | r | r | r | r |
с | s | s | s | s | s,ss | s |
т | t | t | t | t | t | t |
у | u | u | u | u | u | u |
ф | f | f | f | f,v,ph | f | f |
х | h | ch | kh | h,ch,kh | ch | kh |
ц | c | c | ts | ts,c,z | z | ts |
ч | č | č | ch | tsch | tsch | ch |
ш | š | š | sh | sch | sch | sh |
щ | ŝ | šč | shch | schtsch | schtsch | shch |
ъ | ʺ | ʺ | ie | |||
ы | y | y | y | y | y | y |
ь | ʹ | ʹ | ,y | |||
э | ė | ė | e | e,ä | e | e |
ю | û | ju | iu | ju,iu,ü | ju | yu |
я | â | ja | ia | ja,ia | ja | ya |
Для передачи русских имен и фамилий в России используется сейчас транслитерация на основе английского языка, смотрите систему транскрипции в Приказе МИД России, N 4271. В Германии переводчики используют для перевода систему ISO-9 от 1995 года. В связи с этим могут быть отличия в написании имен собственных в русских заграничных документах и их переводе на немецкий язык.
§ Таблица транслитерации букв немецкого алфавита в русский алфавит
В таблице 3 представлены соответствия букв и сочетаний букв немецкого алфавита и русского алфавита. Транслитерация немецких букв, имен и фамилий на русский язык не регламентирована, поэтому может отличаться при их передаче в разных случаях.
Таблица 3: Транслитерация немецких букв и слогов в русские
Немецкие буквы и сочетания букв | Русские буквы и сочетания букв |
---|---|
a | а |
aa | а |
ai | ай |
b | б |
c | к,ц |
ch | х,ш |
chh | хг |
chs | кс |
ck | к,кк |
d | д |
e | е,э |
ee | е |
ei | ай,ей,эй |
eu | ой,ей,эй |
f | ф |
g | г |
gk | г |
h | х,г, |
i | и |
ie | и,ие |
j | й |
ja | я,ья |
je | е,ье |
jo | йо,ьо |
ju | ю,ью |
jä | е,ье |
jü | ю,ью |
k | к |
l | л,ль |
ll | лл,ль,лль |
m | м |
n | н |
nn | н |
o | о |
oo | о |
p | п |
ph | ф |
qu | кв |
r | р |
s | с,з |
sch | ш |
sp | шп,сп |
ss | сс |
st | шт,ст |
t | т |
tion | цион |
ts | тц,ц |
tsch | ч |
u | у |
v | ф,в |
w | в |
x | кс |
y | и |
z | ц |
zsch | ч |
ß | с |
ä | э,е |
ö | э,ё |
ü | ю,и |
§ Правила транслитерации немецкого языка
Правила передачи немецких букв(гласных и согласных) на русский язык
При передаче немецких букв на русский язык, используются следующие основные правила:
- ä в начале слова и после гласных букв передается как э, а после согласных как е
- e в начале слова и после гласных передается как э, а после согласных и буквы «i» в разных слогах как е
- ö обычно передается как ё, а в начале слова как э
- ü обычно передается как ю, а в начале слова как и
- c перед гласными буквами a, o, u и согласными передается как к, а перед гласными e, i, y как ц
- h обычно вообще не передается, но в начале слога и между гласными — как х или г
- буква j передается как й, но перед гласными «a», «ä», «e», «o», «u», «ü» может переводиться соответственно как я, е, е, йо, ю, ю или ья, ье, ье, ьо, ью, ью
- l между согласными и в конце слова передается с мягким знаком ль
- s перед гласными передается как з, в конце слова и перед согласными как с, в сочетании с «sp», «st» обычно сп, ст, но в начале слова шп, шт
- v обычно передается как ф, а между гласными как в
Правила передачи сочетаний и слогов немецких букв на русский язык
- сочетание букв ei передается как ай, но иногда как ей или эй
- сочетание букв eu передается как ой, но иногда как ей или эй
- сочетание ie в одном слоге передается как и, а в разных как ие
- ch обычно передается как х, а в словах иностранного происхождения, где читается буква «ш» как ш
- ck передается как к, но если стоит между гласными, то как кк
- суффикс nn в фамилиях на -mann передается как н
- суффикс tion передается как цион
- сочетание tz передается как ц, а между гласными как тц
§ Полезные ссылки
Комментарии посетителей:
Транслитерация списка литературы на латиницу
Инструкция по автоматической транслитерации
В англоязычном блоке статьи размещается список литературы на латинице (References) в соответствие с Harvard System of Referencing Guide.
Элементы описания работ на кириллице (на русском, украинском и др.) должны транслитерироваться автоматически буквами латинского алфавита по стандарту BSI.
Для этого рекомендуем использовать сайт Транслитерация BSI
(https://antropophob.ru/utility-i-prochie-melochi/16-transliteratsiya-bsi)
Внимание: имена иностранных авторов ни в коем случае не транслитерируются, приводятся только в оригинальном (общераспространенном) написании (проверить правильность написания можно, например, с помощью поисковой системы Google или переводчика Google Translate)
Пожалуйста, транслитерируйте списки только автоматически, вручную неизбежны трудно устранимые ошибки. Не подменяйте в русскоязычной версии буквы кириллицы схожими латинскими, иначе транслитерация будет неверной.
Транслитерация кириллицы – стандарт BSI
а – a | к – k | х – kh |
| Исключения: написание некоторых фамилий (например, автор устойчиво транслитерирует свою фамилию иным образом либо сложилась определенная традиция) и географических названий (рекомендуем обращение к справочникам). Примеры исключений |
б – b | л – l | ц – ts |
| |
в – v | м – m | ч – ch |
| |
г – g | н – n | ш – sh |
| |
д – d | о – o | щ – shch |
| |
е – e | п – p | ъ – » |
| |
ё – e | р – r | ы – y |
| |
ж – zh | с – s | ь – ‘ |
| |
з – z | т – t | э – e |
| |
и – i | у – u | ю – yu |
| |
й – i | ф – f | я – ya |
Правила оформления списка литературы и библиографии на латинице (References)
По тексту статьи используется последовательная нумерация ссылок на список литературы, размещенный в конце статьи:
- Библиографическая ссылка оформляется в тексте в квадратных скобках [номер в списке литературы, номера страниц]. Пример: [1, с. 5-8];
- Список литературы с полным библиографическим описанием размещается после основного текста статьи (≤ 30 источников литературы).
Для всех книжных изданий необходимо указать общее количество страниц, для статей − номера страниц, на которых они расположены. Неопубликованные источники в список литературы не включаются.
Кроме списка литературы в традиционной форме, автор также должен оформить библиографию на латинице (References) в соответствие с Harvard System of Referencing Guide
- Наряду с информацией об авторе, дате публикации, названии издания, номеров страниц, библиографическое описание должно включать DOI (digital object identifier) (при его наличии).
- Проверить наличие DOI на библиографическую ссылку можно по ссылке.
- References оформляется отдельным блоком в статье на латинице по следующему принципу:
* Книга, изданная за рубежом: Автор (ы), год публикации, Название публикации, Издатель, номера страниц. doi (при наличии).
Пример:
Allcock, J. B., Arnold, C. Day, A. J. 1992, Border and Territorial Disputes, London, Longman, 1992, pp. 6-10.
* Книга (первоисточник на кириллице): Автор (ы), год публикации, название публикации (транслитерация курсивом) [перевод названия публикации на английском языке], Издатель, номера страниц. doi (при наличии). (указание языка первоисточника)
Пример:
Tarasov, I. N. 2009, Politicheskie instituty i praktiki postkommunizma v Central’no-Vostochnoj Evrope [Political institutions and practice of post-communism in Central-Eastern Europe], Saratov. (In Russ.)
* Глава в книге: Автор (ы) публикации, год публикации, ‘Название главы (статьи, раздела)’ in авторы книги Название книги, Издатель, номера страниц. doi (при наличии).
Пример:
Crawford, S. E. S., Ostrom, E. A. 2005, ‘Grammar of Institutions’ in E. Ostrom, N. J. Princeton(eds) Understanding Institutional Diversity, Princeton University Press, pp. 137—174.
* Материалы конференции: Автор (ы) публикации, год публикации, Название статьи (раздела). In: авторы трудов конференции, Название издания, Название, место и дата проведения конференции, Издатель, номера страниц. DOI (при наличии).
Пример:
Rekord, S. I. 2016, The economic potential of the Baltic Sea Region in the global turbulence, «zamykaniya effect» or «safe haven»? In: Klemeshev, A. P., Mezhevich, N. M., Fedorov, G. M. Pribaltijskiye issledovaniya v Rossii, Materials of the International Scientific Conference, 12-17 July 2015, Kaliningrad. (In Russ.)
* Журнал: автор (ы), год, Название статьи, Название журнала, том (номер), страницы. doi (при наличии).
Пример:
Mezhevich, N. 2016, Eastern Europe. On the centenary of the political project, Baltic Region, vol. 8, no.1, pp.17-32. doi:10.5922/2079-8555-2016-1-2.
* Журнал (первоисточник на кириллице): Автор (ы), год, Перерод названия статьи на английском языке, Название журнала (транслитерация курсивом) [перевод названия журнала на английском языке], том, номер, страницы. doi (при наличии). (указание языка первоисточника)
Пример:
Vasilyeva, N. A., Kosov, Yu. V. 2015, Eurasian region: the dialectic of modern development, Evraziiskaya integratsiya: ekonomika, pravo, politika [Eurasian Integration: Economics, Law, Politics], vol. 5, no. 1, pp. 149—154. (In Russ.)
* Веб-сайт: автор (ы), год, Название публикации, Сайт (источник), URL (дата обращения).
Пример:
Jost, T. 2011, Outward FDI from Germany and its policy context: update 2011, Columbia FDI Profiles, available at: http://www.vcc.columbia.edu (accessed 8 September 2011).
Samorukov, M. 2016, The legacy of the socialist camp. Why Eastern Europe is doomed to live poorer half of Germans, Carnegie Moscow Center, available at: http://carnegie. ru/commentary/?fa=64958 (accessed 10 September 2016). (In Russ.)
ПРАКТИЧЕСКАЯ ТРАНСКРИПЦИЯ ФАМИЛЬНО-ИМЕННЫХ ГРУПП ДЛЯ МАШИНОЧИТАЕМЫХ ДОКУМЕНТОВ
ПРАКТИЧЕСКАЯ ТРАНСКРИПЦИЯ ФАМИЛЬНО-ИМЕННЫХ ГРУПП ДЛЯ МАШИНОЧИТАЕМЫХ ДОКУМЕНТОВ
А. В. Бондаренко
Государственный Научно Исследовательский Институт Авиационных Систем
С. В. Ёлкин
Московский Государственный Инженерно Физический Институт (университет)
Э. С. Клышинский
Московский Государственный Интститут Электроники и Математики
О. Ю. Слёзкина
Российский Государственный Гуманитарный Университет
Ключевые слова. Машинная транскрипция, фонетика, фонетическая таблица, многоязыковая система, транслитерация.
Для задачи практической транскрипции фамильно-именных групп составлена единая фонетическая таблица. Использование уже имеющихся таблиц вызывает объективные трудности. Транскрипция при этом осуществляется в два этапа. На первом этапе фамильно-именная группа переводится в промежуточное фонетическое написание, в соответствие с таблицей, а затем из него – в кириллическое написание. Сама транскрипция осуществляется за счет работы программного движка, который остается неизменным при присоединении к нему баз транскрипции различных языков
Созданная программа «ТрансСкриба» позволяет успешно решить проблемы качественной транскрипции. При этом программа может использоваться не только для транскрипции фамильно-именных групп, но и других слов языка, записанных в латинском алфавите.
- Введение
Одной из важных задач, встающих при оформлении и обработке машиночитаемых документов, является правильная транскрипция фамильно-именных групп на русский язык. Эта задача имеет системный характер. Для её решения требуется устранить множество разнородных проблем:
- Наличие в некоторых странах нескольких национальных систем транскрипции и транслитерации с национального языка на латиницу, причем часто конкурирующих.
Например: пиньин и Уэйда в китайском; ромадзи, кунрэй («официальная») и система Хёпберна в японском; ГОСТ 16876-71, ISO 9, Библиотеки конгресса Соединенных Штатов, АH СССР, Yellow pages в русском и т.д..
- Отсутствие или плохая разработанность систем транскрипции в некоторых языках на кириллицу, например в арабском, турецком и др.
Во многих языках (например, в английском) зачастую нет однозначных правил транскрипции, либо имеется большое количество диалектов, затрудняющих выбор правильного варианта перевода.
- Отсутствие точного фонетического соответствия между звуками различных языков.
Во всех естественных языках в целом имеется приблизительно 100 фонем, звуков же несколько сотен, в то время как в каждом отдельном языке их несколько десятков. Это приводит к тому, что при создании систем транскрипции приходится ставить в приблизительное соответствие звукам одного языка звуки другого. При этом зачастую теряется важная фонетическая информация, такая как длительность, палатализованность, высота тона и др.
- В общем случае отсутствует взаимнооднозначное соответствие при транскрипции с национального языка на латиницу и обратно.
В соответствии с международными требованиями машиночитаемые документы оформляются латинскими буквами, в связи с чем при транскрипции берется не само слово языка-оригинала со всеми его специфическими буквами и диакритиками, а оно же, записанное латиницей.
- Трудности при переводе имен собственных на латиницу средствами национальных систем транскрипции для лиц, чьи имена принадлежат другому языку или вообще иной языковой группе. Например, перевод с испанского языка фамилии француза (François Krauth), проживающего в Испании, на латиницу (Franсois Krauth), а затем на кириллицу: вместо Франсуа Крот, его фамилия будет переведена на русский как Франкоис Краутх (в соответствии с правилами испанского языка).
- Отсутствие исчерпывающего списка имен для каждого языка (хотя бы собственно имен, а не фамилий). В противном случае проблема могла бы быть решена уникальным переводом каждого имени и создания баз данных таких переводов.
- Борьба между правилами транскрипции, принятыми в настоящее время, и исторической традицией при переводе иностранных имён, а также возникающие при переводе проблемы неблагозвучности.
- Встречающиеся в практике случаи перевода в художественной литературе имен собственных по смыслу.
- Отсутствие единого мирового стандарта для перевода имен собственных с различных языков (хотя бы на латиницу).
Указанные выше трудности делают создание многоязыковой машинной системы транскрипции фамильно-именных групп особенно ценным.
2. Анализ существующих средств машинного перевода фамильно-именных групп
— перевод, при котором некоторому часто встречающемуся имени ставится в соответствие его эквивалент, устоявшийся в данном языке в данный период времени;
— транскрипция (точнее практическая транскрипция), когда имени собственному одного языка ставится в соответствие слово другого языка, наиболее точно отражающее его звучание в родном языке;
— транслитерация – побуквенная передача имен собственных, записанных с помощью одной графической системы, средствами другой графической системы. Базируясь на каком-либо алфавите, транслитерация допускает условное употребление букв, введение дополнительных и диакритических знаков.
Было проведено тестирование различных программных средств, доступных для пользователей сети Интернет или продаваемых на рынке. Для тестирования была составлены выборки, причем в их состав входили не только имена, характерные для данного языка, но и переведенные на него с других языков. Таким образом, моделировалась ситуация, имеющая место в практических задачах.
Результаты тестирования записывались в виде таблицы, в которой основными пунктами сравнения было количество ошибок разных видов:
Вид ошибки | Вес Wiошибки |
Не переведена вся фамильно-именная группа | 1 |
Не переведен один из элементов фамильно-именной группы (имя или фамилия) | 0,5 |
Не переведен символ (буква) | 0,03 |
Пропущена буква | 0,02 |
Вставлена лишняя буква | 0,02 |
Две буквы переставлены местами | 0,04 |
Не верно вставлена буква | 0,02 |
Не отделена приставка | 0,02 |
Формула расчета качества перевода имела вид:
Мера качества перевода- M,
Количество ошибок данного типа – Ni ,
Вес ошибки – Wi
M=, где К – количество типов ошибок.
Формула применима на конкретной конечной выборке, для использования её на произвольной выборке необходима нормировка по каждому типу ошибок (см. второй столбец таблицы).
Из десяти протестированных программ 7 являлись транслитераторами, никак не учитывающими особенности и правила чтения в том или ином языке, одна машинный переводчик, и две транскрипторы. Для выборки в 100 имен собственных количество ошибок колебалось от 70 до 150 штук, а мера качества перевода от 3,3 до 10,5. Наилучшее качество показали Betelgeuse Tr (3,8) и Argrig’s Trans (3,3). Отсутствие ориентации на определенный язык, естественно, приводило ко множеству ошибок. Так, например, José Cristóbal (Хосе Кристобаль) одним из транслитераторов (HS Transliter) был переведен как Жосе Цристобал, а другим (Cifrica) Джосе Сристобал. В том и в другом случае не учитывались правила чтения испанского языка (такие как: «с» перед согласной читается как «к», «j» — как «х», а не как «ж» или «дж» и т.д.). Из сказанного выше становится очевидно, что транслитерация, широко используемая пользователями компьютерных сетей, для наших целей оказывается непригодной. Она не может обеспечить качественного перевода фамильно-именной группы не просто на латиницу, а на определенный язык, чтобы при этом носители этого языка произносили ее максимально близко к ее звучанию на родном языке.
Две протестированные программы при переводе использовали метод транскрипции, однако недостатков перевода у них было не намного меньше. Первая из них (Hieroglyph) довольно хорошо перевела всего лишь около трети предложенных ей фамильно-именных групп, остальные же оставила без перевода. Вторая (Translit to Cyrillic) перевела все фамилии, однако процент ошибок был очень велик.
И последняя из протестированных нами программ – машинный переводчик Промт – выдала самый лучший результат, однако в переводе, помимо оставленных без перевода слов и неверно переведенных букв и буквосочетаний, были зафиксированы также ошибки, когда слово именно «переводилось», т. е. вместо звукового соответствия имело место смысловое. Например, Corse Matin была переведена как Корсика Утро, что неприемлемо при работе с фамильно-именными группами.
В результате, оказалось, что задача создания машинной системы, осуществляющей практическую транскрипцию с приемлемым качеством, так и не решена.
3. Создание единой фонетической таблицы
Традиционный подход, принятый в практической транскрипции, требует составления отдельной таблицы транскрипции с каждого исходного языка на каждый язык перевода. Внедрение этих таблиц в код программного продукта требует совместной работы как программистов, так и лингвистов, что может являться затруднительным или невозможным при большом количестве языков. В связи с этим было принято решение создать программный продукт, работа которого основывается на единой фонетической таблице, что является фактором, в корне отличающим систему от ей подобных. Создание единой фонетической таблицы для всех языков позволило намного сократить количество правил транскрипции, работу по их написанию и, главное, улучшило качество транскрипции.
Если в существующих системах перевод осуществлялся напрямую с исходного языка на язык перевода (что, как отмечалось, требует написания правил транскрипции для каждой такой пары языков), то использование единой фонетической таблицы позволило писать для каждого языка лишь правила с исходного языка в знаки из этой таблицы и обратно. Транскрипция при этом осуществляется в два этапа: на первом этапе фамильно-именная группа переводится в промежуточное фонетическое написание в соответствии с таблицей, а затем из него – в кириллическое написание (при переводе, например, с английского языка на русский). Сама транскрипция осуществляется за счет работы программного движка, который остается неизменным при присоединении к нему баз транскрипции различных языков. В связи с этим совместная работа программистов и лингвистов потребовалась лишь на начальных этапах – создание и отладка программного движка транскрипции.
Важной задачей при таком подходе являлось само создание фонетической таблицы, т.е. отбор звуков таким образом, чтобы в таблице присутствовали все звуки исследуемых языков, и в то же время ни один звук не был представлен двумя символами. Использование уже имеющихся таблиц вызвало объективные трудности. Так, например, различные, но сходные звуки, обычно передаются одним и тем же знаком, хотя их реальное звучание и транскрипция, будут различны. В качестве примера можно привести английское «л» и немецкое «ль», обозначаемые «l»; или же французское «у» (близкое русскому «ю») и турецкое «ы», обозначаемые в традиционных грамматиках одним и тем же знаком «y». С другой стороны, многие оттенки фонем, важные и характеристические с теоретической точки зрения, при практической транскрипции могут быть отнесены на второй план и передаваться как параметры одного и того же знака промежуточного фонетического написания. Так, например, при практической транскрипции не различаются французское (дорсо-увулярное) и японское (или русское) «р» (апико-альвиолярное) или же средне-верхнее по подъему и средне-нижнее «о».
Прежде чем приступать к созданию таблицы нами был проанализирован материал различных языков. Таблица создавалась по принципу объединения множеств звуков разных языков, при этом возникали вопросы: обозначать ли звуки разных языков одним символом (возможно, с разными параметрами) или же разными. Ориентируясь при транскрибировании в основном на фонетическую форму слова, необходимо было одновременно учитывать и орфографический момент с тем, чтобы, не препятствуя правильному чтению, по возможности сохранить при передаче слова близость к его графической форме. Так, например, возник вопрос, следует ли английское q (на письме “th”) и испанское ¢ (на письме “c”), похожее на него по звучанию, обозначать одним и тем же символом или нет. Тут вступают в противоречие принципы фонетического и графического подобия. В данном конкретном случает вопрос был решен в пользу их различения (передачи испанского «с» в английском буквой «с») из-за того, что в американских диалектах испанского языка эта буква читается как «с», что сближает ее с графическом написанием в английском.
Еще одной сложностью является транскрипция фамильно-именных групп, передаваемых в соответствии с орфоэпической традицией языка-оригинала, либо языка, на который осуществляется транскрипция. Существенной помощью здесь является то, что русский язык не является застывшим. Многие фамилии и имена были транскрибированы достаточно давно и в отношении строго определенных людей, оставивших свой след в истории. Более того, истории известны примеры, когда людей, принадлежащих к одной семье, транскрибировали в разные периоды различным образом. Даже транскрипция имени одного человека может сильно изменяться со временем. Эволюция написания под влиянием фонетической тенденции ясно прослеживается на передаче фамилии английского политического деятеля XVIII века R. Walpole. В энциклопедическом словаре Брокгауза и Ефрона изд. 1891 г. он значится как Вальполь, в 6 томе БСЭ изд. 1951 г. дается транскрипция Вальпол, а в 44 томе БСЭ изд. 1956 г. и позже — чисто фонетический вариант: Уолпол.
Транскрипция же имен их современных однофамильцев позволяет использовать текущие представления о правилах фонетики. Например, Hamlet, Prince of Denmark — Гамлет, принц Датский. По нашим теперешним понятиям ему скорее следовало бы быть Хамлетом (или даже Хэмлетом), так как русское орфоэпическое Г — звук взрывной, а не фрикативный. Однако принц Датский так и остается Гамлетом, ибо именно в таком виде он давно уже вошел в русскую культуру и всем знаком, а его современные тезки оказываются Хамлетами.
4. Программа машинной транскрипции
В основу программного движка системы машинной транскрипции был положен декларативный принцип, то есть управление транскрипцией производится за счет правил, записанных в базах. С этой целью был разработан собсвенный формат правил, позволяющий в зависимости от информации во входной строке, производить выходную строку. Логичным в такой ситуации представляется разделение правила на входную и выходную часть. Разработанное представление входной части позволяет находить:
- произвольную букву, обладающую заданными характеристиками и находящуюся в заданном окружении;
- буквосочетания, обладающие или не обладающие заданными признаками;
- анализ букв и буквосочетаний в комбинации с уже транскрибированными фрагментами;
- буквы и буквосочетания, находящиеся в начале или конце слов;
- открытые и закрытые, ударные и безударные буквы.
Выходная часть правила позволяет:
- переносить символы без изменения из входной части цепочки в выходную с последующей их транскрипцией;
- переносить параметры от букв выходной цепочки в буквы выходной цепочки;
- вводить новые символы и их параметры в выходную цепочку;
- расставлять необходимые разделители слов.
При анализе слово проходится слева направо, причем производится поиск правил, применимых к текущей позиции в слове. При наличии нескольких правил, применимых к данной позиции выбирается правило с максимальной длиной анализируемой цепочки. Практика показала применимость такого предположения к алфавитным языкам.
Для обеспечения определения границ слов и слогов в программный движок были добавлены модули слово- и слогоделения. Выделение слов производится по знакам-разделителям, не входящим в алфавит данного языка. Примерами знаков, являющихся разделителями в одном языке, и не являющимися таковыми в другом языке может служить апостроф, означающий в арабском языке звуки смычное «а» или звук «айн». Так же в языках тюркских народов СССР, использующих в качестве алфавита кириллицу, апостроф использовался для обозначения арабского звука «айн» или смычки в словах, заимствованных с арабского языка.
Для выделения слогов всем буквам приписывается параметр, обозначающий являются они слогообразующими или нет. Далее не слогообразующие буквы, стоящие в начале слова, относятся к первому слогу, стоящие в конце слова – к последнему слогу. Буквы, находящиеся между слогообразующими буквами, делятся пополам, причем в случае нечетного количества букв большая часть относится к следующему слогу. Последняя буква каждого слова считается открытой, все остальные – закрытыми.
Созданная программа «ТрансСкриба» позволяет успешно решить изложенные выше задачи с учетом указанных трудностей. При этом она может использоваться не только для транскрипции фамильно-именных групп, но и других слов языка, записанных в латинском алфавите, например, географических названий. На момент написания данной работы программа позволяет транскрибировать с 10 основных европейских и азиатских языков. Количество ошибок на тех же выборках на которых тестировались другие программы по некоторым языкам составляет всего 10-15 штук, а мера качества перевода 0,2-0,4.
Литература
- Реформатский А.А. Введение в языкознание Гл. 3. Фонетика. М.: Аспект Пресс, 1996;
- Трубецкой Н.С. Основы фонологии. М.:НЛ, 1960.
Practical transcription of name groups for machine-readable documents
- V. Bondarenko, S. V. Yolkin, E. S. Klyshinsky, O. Yu. Slyozkina
Keywords. Machine transcription, phonetics, phonetics table, multilanguage system, transliteration.
Because using of existent tables are complicated, the unified phonetics table was conducted for the task of practical name groups transcription resolving in this paper. Transcription accomplishes in two steps. On the first step name group translated into intermediate phonetic spelling, according to the unified phonetics table, and on the second step – into Cyrillic. The transcription accomplishes by software engine, which stays unchanged during different languages transcription databases connection.
The developed program “TransScriba” allows successfully solves the problem of qualitative transcription. The program can be used not only for name group transcription, but other words written in Roman alphabet.
Тематика | Число статей |
Аварийное восстановление | 1 |
Авиационная медицина | 6 |
Авиация | 948 |
Австрийское выражение узус | 2 |
Автодорожное право | 17 |
Автоматика | 70 |
Автоматическое регулирование | 19 |
Автомобили | 1. 148 |
Авторское право | 9 |
Агрономия | 2 |
Агрохимия | 26 |
Административное деление | 1 |
Административное право | 55 |
Азартные игры | 42 |
Аккумуляторы | 6 |
Акридология | 4 |
Акупунктура | 1 |
Акустика раздел физики | 21 |
Акушерство | 30 |
Аллергология | 14 |
Альпинизм | 16 |
Альтернативное урегулирование споров | 374 |
Алюминиевая промышленность | 3 |
Американский футбол | 4 |
Американское выражение узус | 1.709 |
Анатомия | 1.127 |
Английский язык | 2 |
Андалусия | 35 |
Анестезиология | 14 |
Антарктика | 1 |
Антильские острова | 39 |
Античность кроме мифологии | 2 |
Антропология | 11 |
Арагон | 23 |
Аргентина | 1.393 |
Арго | 4 |
Артиллерия | 25 |
Архаизм | 154 |
Археология | 63 |
Архитектура | 327 |
Астрология | 9 |
Астрометрия | 4 |
Астрономия | 182 |
Астрофизика | 12 |
Астурия | 7 |
Атомная и термоядерная энергетика | 43 |
Аудит | 19 |
Африка | 2 |
Аэрогидродинамика | 1 |
Аэродинамика | 6 |
Аэропорты и управление водзушным движением | 14 |
Аэрофотосъемка и топография | 1 |
Бактериология | 22 |
Банки и банковское дело | 501 |
Баскетбол | 4 |
Бейсбол | 3 |
Беларусь | 8 |
Бетон | 20 |
Библиография | 1 |
Библиотечное дело | 3 |
Библия | 269 |
Бизнес | 1. 396 |
Биллиард | 1 |
Биогеография | 1 |
Биология | 794 |
Биометрия | 2 |
Биотехнология | 326 |
Биофизика | 1 |
Биохимия | 549 |
Биоэнергетика | 14 |
Биржевой термин | 45 |
Бокс | 3 |
Боливия | 160 |
Борьба | 3 |
Борьба с вредителями | 269 |
Борьба с коррупцией | 3 |
Ботаника | 4.454 |
Бразилия | 25 |
Британское выражение узус | 4 |
Буквальное значение | 11 |
Бурение | 66 |
Бухгалтерский учет кроме аудита | 323 |
Бытовая техника | 43 |
Валютный рынок форекс | 4 |
Валюты и монетарная политика кроме форекс | 1 |
Велосипеды кроме спорта | 26 |
Венерология | 1 |
Венесуэла | 428 |
Вентиляция | 7 |
Вертолёты | 11 |
Ветеринария | 166 |
Ветроэнергетика | 42 |
Взрывчатые вещества | 61 |
Виноградарство | 43 |
Виноделие | 219 |
Вирусология | 80 |
Внешняя политика | 2 |
Внешняя торговля | 30 |
Водное поло | 1 |
Водные ресурсы | 626 |
Водоснабжение | 176 |
Военная авиация | 24 |
Военно-морской флот | 20 |
Военный жаргон | 8 |
Военный термин | 1. 901 |
Возвышенное выражение | 5 |
Воздухоплавание | 6 |
Восклицание | 2 |
Всемирная торговая организация | 3 |
Вулканология | 9 |
Вульгаризм | 1 |
Выборы | 15 |
Высокопарно | 86 |
Выставки | 4 |
Газовые турбины | 8 |
Газоперерабатывающие заводы | 16 |
Галисия | 7 |
Гальванотехника | 2 |
Гастроэнтерология | 21 |
Гватемала | 242 |
Гематология | 22 |
Генеалогия | 2 |
Генетика | 278 |
Генная инженерия | 6 |
География | 722 |
Геодезия | 95 |
Геология | 12.701 |
Геометрия | 93 |
Геоморфология | 2 |
Геофизика | 198 |
Геохронология | 9 |
Геральдика | 14 |
Германия | 26 |
Герпетология вкл. с серпентологией | 1 |
Гигиена | 7 |
Гидравлика | 9 |
Гидрогеология | 4 |
Гидрография | 41 |
Гидрология | 67 |
Гидромеханика | 1 |
Гидротехника | 30 |
Гидроэлектростанции | 45 |
Гимнастика | 2 |
Гинекология | 20 |
Гипсокартон и сис-мы сухого строительства | 1 |
Гистология | 27 |
Голландский нидерландский язык | 3 |
Гольф | 1 |
Гомеопатия | 6 |
Гонки и автоспорт | 8 |
Горное дело | 299 |
Горные лыжи | 6 |
Городская застройка | 7 |
Горюче-смазочные материалы | 5 |
ГОСТ | 35 |
Гостиничное дело | 43 |
Государственный аппарат и госуслуги | 1 |
Гражданско-процессуальное право | 2 |
Гражданское право | 6 |
Грамматика | 379 |
Грубо | 543 |
Двигатели внутреннего сгорания | 39 |
Дегустация | 1 |
Деловая лексика | 7 |
Делопроизводство | 7 |
Демография | 47 |
Деревообработка | 104 |
Дерматология | 23 |
Детали машин | 252 |
Детская речь | 4 |
Дефектоскопия | 3 |
Диалектизм | 7 |
Дизайн | 4 |
Дипломатия | 131 |
Дистанционное зондирование Земли | 6 |
Документооборот | 26 |
Домашние животные | 3 |
Доменное производство | 2 |
Доминиканская Республика | 37 |
Дорожное движение | 140 |
Дорожное дело | 75 |
Дорожное покрытие | 9 |
Дорожное строительство | 17 |
Дорожный знак | 7 |
Дословно | 1 |
Древнегреческая и древнеримская мифология | 5 |
Европейский банк реконструкции и развития | 15 |
Евросоюз | 29 |
Единицы измерений | 32 |
Естественные науки | 9 |
Жаргон | 527 |
Железнодорожный термин | 460 |
Живопись | 199 |
Животноводство | 222 |
Журналистика терминология | 41 |
Заболевания | 36 |
Занятость | 8 |
Звукоподражание | 12 |
Здравоохранение | 202 |
Золотодобыча | 9 |
Зоология | 870 |
Зоотехния | 5 |
Зубная имплантология | 6 |
Игры кроме спорта | 7 |
Идиоматическое выражение | 165 |
Издательское дело | 4 |
Измерительные приборы | 31 |
Изоляция | 30 |
Имена и фамилии | 14 |
Иммунология | 82 |
Имя | 26 |
Инвестиции | 57 |
Инженерная геология | 5 |
Инженерное дело | 14 |
Инструменты | 25 |
Интегральные схемы | 4 |
Интернет | 410 |
Информационная безопасность | 20 |
Информационные технологии | 622 |
Ирония | 162 |
Искусственный интеллект | 12 |
Искусство | 196 |
Испано-американский жаргон | 2 |
Испанский язык | 171 |
Исторические личности | 2 |
История | 1. 060 |
Итальянский язык | 1 |
Ихтиология | 966 |
Кабели и кабельное производство | 235 |
Кадры | 18 |
Казахстан | 3 |
Канада | 5 |
Канализация и очистка сточных вод | 20 |
Канцеляризм | 56 |
Кардиология | 60 |
Карибский регион | 2 |
Картография | 17 |
Карточные игры | 128 |
Карьерные работы | 7 |
Каспий | 1 |
Католицизм | 21 |
Квантовая механика | 16 |
Керамика | 86 |
Керамическая плитка | 17 |
Кибернетика | 7 |
Кинематограф | 123 |
Киноосветительная аппаратура | 1 |
Киносъёмочная аппаратура | 1 |
Кинотехника | 1 |
Кирпичное производство | 5 |
Китайский язык | 1 |
Климатология | 11 |
Клинические исследования | 44 |
Клише | 9 |
Книжное/литературное выражение | 1.531 |
Кожевенная промышленность | 94 |
Коллоидная химия | 1 |
Колумбия | 1. 082 |
Комиксы | 1 |
Коммунальное хозяйство | 20 |
Компьютерная графика | 24 |
Компьютерная томография | 2 |
Компьютерные игры | 9 |
Компьютерные сети | 19 |
Компьютерный жаргон | 2 |
Компьютеры | 387 |
Кондитерские изделия | 7 |
Кондиционеры | 8 |
Коневодство | 2 |
Конный спорт | 4 |
Контекстуальное значение | 1 |
Контроль качества и стандартизация | 80 |
Корма | 3 |
Корпоративное управление | 2.340 |
Косметика и косметология | 112 |
Космонавтика | 107 |
Космос | 6 |
Коста-Рика | 125 |
Кофе | 5 |
Красители | 257 |
Криминология | 29 |
Криптография | 3 |
Кристаллография | 5 |
Куба | 890 |
Кулинария | 850 |
Культурология | 49 |
Лабораторное оборудование | 46 |
Лазеры | 5 |
Лакокрасочные материалы | 153 |
Ландшафтный дизайн | 13 |
Ласкательно | 7 |
Латиноамериканский сленг | 14 |
Латиноамериканское выражение | 175 |
Латынь | 67 |
ЛГБТ | 3 |
Лесоводство | 3. 053 |
Лесозаготовка | 10 |
Лесохимия | 1 |
Лингвистика | 554 |
Линии электропередач | 4 |
Литейное производство | 1 |
Литература | 336 |
Лифты | 2 |
Логика | 36 |
Логистика | 72 |
Логопедия | 2 |
Магнетизм | 162 |
Магнитнорезонансная томография | 1 |
Майкрософт | 15.054 |
Малайский язык | 1 |
Малярное дело | 1 |
Маммология | 3 |
Маркетинг | 128 |
Марокко | 4 |
Масложировая промышленность | 32 |
Математика | 5.716 |
Математический анализ | 5 |
Материаловедение | 40 |
Машиностроение | 93 |
Машины и механизмы | 7 |
Мебель | 79 |
Медико-биологические науки | 1 |
Медицина | 8.426 |
Медицинская техника | 31 |
Международная торговля | 13 |
Международное право | 15 |
Международные отношения | 31 |
Международные перевозки | 7 |
Международный валютный фонд | 14.093 |
Мексиканское выражение | 1.788 |
Мелиорация | 2 |
Менеджмент | 118 |
Местное название | 3 |
Металловедение | 29 |
Металлообработка | 5 |
Металлургия | 1.060 |
Метеорология | 41 |
Метрология | 19 |
Метрополитен и скоростной транспорт | 5 |
Механика | 143 |
Механика грунтов | 1 |
Микология | 17 |
Микробиология | 127 |
Микроскопия | 1 |
Микроэлектроника | 8 |
Минералогия | 543 |
Министерство иностранных дел | 3 |
Мифология | 150 |
Млекопитающие | 65 |
Мобильная и сотовая связь | 8 |
Мода | 24 |
Молекулярная биология | 20 |
Молекулярная генетика | 8 |
Молодёжный сленг | 2 |
Молочное производство | 179 |
Морской термин | 1.672 |
Мотоциклы | 4 |
Мрачно | 1 |
Музеи | 6 |
Музыка | 647 |
Музыкальные инструменты | 2 |
Мультимедиа | 1 |
Мультфильмы и мультипликация | 11 |
Мучное производство | 2 |
Мясное производство | 40 |
Навигация | 7 |
Надёжность | 1 |
Название лекарственного средства | 32 |
Название организации | 2.749 |
Налоги | 164 |
Нанотехнологии | 31 |
Напитки | 48 |
Народное выражение | 2 |
НАСА | 1 |
Насосы | 12 |
НАТО | 3 |
Научно-исследовательская деятельность | 149 |
Научный термин | 118 |
Неврология | 28 |
Недвижимость | 157 |
Нейропсихология | 3 |
Немецкий язык | 2 |
Неодобрительно | 85 |
Неологизм | 21 |
Неорганическая химия | 1 |
Нефрология | 3 |
Нефтегазовая техника | 51 |
Нефтеперерабатывающие заводы | 38 |
Нефтепромысловый | 115 |
Нефть | 599 |
Нефть и газ | 290 |
Нотариальная практика | 43 |
Нумизматика | 9 |
Обогащение полезных ископаемых | 2 |
Обработка данных | 99 |
Образное выражение | 169 |
Образование | 758 |
Обувь | 623 |
Общая лексика | 254.555 |
Общественное питание | 1.620 |
Общественные организации | 68 |
Обществоведение | 2 |
Одежда | 132 |
Океанология океанография | 50 |
Оконное производство | 6 |
Окружающая среда | 5.300 |
Онкология | 30 |
ООН Организация Объединенных Наций | 6.038 |
Операционные системы | 2 |
Оптика раздел физики | 92 |
Оптическое волокно | 1 |
Организационно-правовые формы компаний | 12 |
Организация производства | 181 |
Органическая химия | 76 |
Оргтехника | 11 |
Орнитология | 136 |
Ортопедия | 6 |
Оружие и оружейное производство | 26 |
Оружие массового поражения | 8 |
Отопление | 6 |
Официальный стиль | 104 |
Офтальмология | 55 |
Охота и охотоведение | 92 |
Охрана труда и техника безопасности | 42 |
Ошибочное или неправильное | 2 |
Паблик рилейшнз | 8 |
Палеоботаника | 1 |
Палеонтология | 28 |
Панама | 196 |
Паразитология | 5 |
Парапсихология | 4 |
Парикмахерское дело | 17 |
Парфюмерия | 34 |
Патенты | 5.564 |
Патология | 12 |
Педагогика | 3 |
Педиатрия | 13 |
Переносный смысл | 4.713 |
Переплётное дело | 39 |
Перу | 445 |
Печатные платы | 1 |
Пивоварение | 54 |
Пищевая промышленность | 980 |
Плавание | 9 |
Планирование | 48 |
Пластмассы | 283 |
Поговорка | 351 |
Погрузочное оборудование | 14 |
Подводное плавание | 1 |
Подводные лодки | 6 |
Пожарное дело и системы пожаротушения | 44 |
Полезные ископаемые | 14 |
Полиграфия | 346 |
Полимеры | 59 |
Политика | 1.932 |
Политэкономия | 30 |
Полиция | 85 |
Полупроводники | 14 |
Порошковая металлургия | 1 |
Португальский язык | 10 |
Пословица | 465 |
Почвоведение | 81 |
Почта | 11 |
Почтительно | 4 |
Пошив одежды и швейная промышленность | 6 |
Поэзия терминология | 2 |
Поэтический язык | 238 |
Права человека и правозащитная деят. | 1 |
Правоохранительная деятельность | 1 |
Презрительно | 141 |
Пренебрежительно | 96 |
Прессовое оборудование | 1 |
Преступность | 2 |
Приводы | 5 |
Прикладная математика | 6 |
Природные ресурсы и охрана природы | 2 |
Программирование | 96 |
Программное обеспечение | 173 |
Проекторы | 1 |
Производственные помещения | 5 |
Производство | 77 |
Производство спирта | 22 |
Производство электроэнергии | 1 |
Прокат металлургия | 2 |
Промышленная гигиена | 3 |
Промышленность | 63 |
Просторечие | 5.029 |
Противовоздушная оборона | 3 |
Профессиональный жаргон | 16 |
Профсоюзы | 2 |
Процессуальное право | 18 |
Прямой и переносный смысл | 4 |
Психиатрия | 33 |
Психогигиена | 2 |
Психология | 301 |
Психопатология | 11 |
Психотерапия | 23 |
Психофизиология | 5 |
Птицеводство | 4 |
Публичное право | 46 |
Пульмонология | 8 |
Пуэрто-риканский диалект испанского языка | 59 |
Пчеловодство | 3 |
Радио | 79 |
Радиоастрономия | 1 |
Радиолокация | 97 |
Разговорная лексика | 22.525 |
Ракетная техника | 60 |
Распределение энергии | 1 |
Растениеводство | 188 |
Расходометрия | 2 |
Региональное выражение не варианты языка | 189 |
Редко | 20 |
Резиновая промышленность | 204 |
Реклама | 73 |
Религия | 588 |
Рентгенография | 1 |
Рентгенология | 23 |
Риторика | 41 |
Робототехника | 28 |
Россия | 7 |
Ругательство | 17 |
Рукоделие | 1 |
Русский язык | 1 |
Рыбалка хобби | 10 |
Рыбоводство | 1.073 |
Рыболовство промысловое | 1.319 |
Садоводство | 50 |
Сальвадорский диалект испанского языка | 57 |
Санитария | 20 |
Сантехника | 56 |
Сахалин | 2 |
Сахарное производство | 60 |
Сварка | 45 |
Светотехника кроме кино | 16 |
Связь | 101 |
Сейсмология | 6 |
Сексопатология | 6 |
Сельское хозяйство | 2.028 |
Сигнализация | 5 |
Силикатная промышленность | 15 |
Силовая электроника | 238 |
Системы безопасности | 166 |
Сказки | 26 |
Складское дело | 13 |
Скульптура | 4 |
Сленг наркоманов | 21 |
Сленг | 444 |
Снабжение | 4 |
Сниженный регистр | 117 |
Собаководство кинология | 39 |
Собирательно | 307 |
Советский термин или реалия | 17 |
Современное выражение | 41 |
Сокращение | 542 |
Солнечная энергетика | 39 |
Сопротивление материалов | 96 |
Социализм | 79 |
Социальное обеспечение | 62 |
Социология | 331 |
Спектроскопия | 41 |
Специи | 51 |
Спецслужбы и разведка | 9 |
Спорт | 1.037 |
Спутниковая связь | 21 |
Средне-китайский | 1 |
Средства индивидуальной защиты | 2 |
Средства массовой информации | 358 |
Станки | 4 |
Старая орфография | 1 |
Статистика | 365 |
Стеклоделие | 32 |
Стилистика | 3 |
Стоматология | 64 |
Страхование | 93 |
Строительные конструкции | 80 |
Строительные материалы | 98 |
Строительство | 1.057 |
Суда на подводных крыльях | 4 |
Судебная лексика | 2 |
Судебная медицина | 1 |
Судостроение | 24 |
Сухопутные силы | 5 |
Сфера обслуживания | 6 |
США | 110 |
Сыроварение | 1 |
Табачная промышленность | 9 |
Табуированная обсценная лексика | 61 |
Тавромахия | 85 |
Таможенное дело | 96 |
Театр | 284 |
Текстильная промышленность | 176 |
Тектоника | 74 |
Телевидение | 173 |
Телеграфия | 1 |
Телекоммуникации | 124 |
Телефония | 42 |
Теннис | 1 |
Тепличные технологии | 1 |
Теплообменные аппараты | 1 |
Теплопередача | 4 |
Теплотехника | 36 |
Термодинамика | 2 |
Техника киносъёмки | 3 |
Техника | 66.410 |
Типографика | 16 |
Ткачество | 8 |
Токсикология | 46 |
Топография | 5 |
Топология | 1 |
Топоним | 296 |
Торговая марка | 19 |
Торговля | 397 |
Торпеды | 1 |
Травматология | 1 |
Трансплантология | 1 |
Транспорт | 300 |
Трансформаторы | 9 |
Трибология | 6 |
Трикотаж | 1 |
Трубопроводная арматура | 1 |
Трубопроводы | 34 |
Трудовое право | 158 |
Турбины | 1 |
Туризм | 223 |
Тяжёлая атлетика | 1 |
Уголовное право | 93 |
Уголовный жаргон | 6 |
Уголь | 2 |
Удобрения | 3 |
Узкоплёночное кино | 1 |
Украина | 2 |
Ультразвук | 1 |
Уменьшительно | 247 |
Университет | 25 |
Уничижительно | 5 |
Упаковка | 49 |
Управление проектами | 31 |
Управление скважиной | 3 |
Урология | 15 |
Уругвайский диалект испанского языка | 47 |
Устаревшее | 2.867 |
Устная речь | 5 |
Утилизация отходов | 33 |
Уфология | 2 |
Фамилия | 6 |
Фамильярное выражение | 52 |
Фантастика, фэнтези | 13 |
Фармакология | 842 |
Фармация | 374 |
Физика металлов | 1 |
Физика твёрдого тела | 1 |
Физика | 618 |
Физиология | 186 |
Физиотерапия | 2 |
Физическая химия | 12 |
Филателия | 3 |
Филиппины | 19 |
Филология | 21 |
Философия | 220 |
Финансы | 727 |
Фольклор | 13 |
Фонетика | 6 |
Фортификация | 3 |
Фотография | 212 |
Фразеологизм | 1.090 |
Французский язык | 3 |
Фундаментостроение | 69 |
Футбол | 190 |
Химическая промышленность | 3 |
Химические волокна | 67 |
Химические соединения | 11 |
Химия | 11.069 |
Хинди | 1 |
Хирургия | 98 |
Хлеб и хлебопечение | 4 |
Хобби, увлечения, досуг | 5 |
Хозяйственное право | 5 |
Холодильная техника | 16 |
Хореография | 1 |
Христианство | 87 |
Хроматография | 45 |
Цветная металлургия | 1 |
Цветоводство | 6 |
Целлюлозно-бумажная промышленность | 161 |
Цемент | 7 |
Ценные бумаги | 7 |
Центральная Америка | 138 |
Церковный термин | 1.342 |
Цирк | 11 |
Цитаты, афоризмы и крылатые выражения | 20 |
Цитология | 44 |
Часовое дело | 21 |
Черчение | 88 |
Чили | 2.095 |
Шахматы | 54 |
Школьное выражение | 8 |
Шоу-бизнес индустрия развлечений | 5 |
Шутливое выражение | 233 |
Эволюция | 4 |
Эвфемизм | 34 |
Эзотерика | 7 |
Эквадор | 327 |
Экология | 244 |
Экономика | 37.925 |
Электрические машины | 172 |
Электричество | 14 |
Электроника | 1.455 |
Электронная почта | 3 |
Электротехника | 286 |
Электротяга | 1 |
Электрофорез | 2 |
Электрохимия | 104 |
Эмбриология | 3 |
Эмоциональное выражение | 147 |
Эндокринология | 3 |
Энергетика | 318 |
Энергосистемы | 24 |
Энтомология | 56 |
Эпидемиология | 34 |
Этнография | 30 |
Этнология | 11 |
Этология | 2 |
Ювелирное дело | 13 |
Южная Америка | 204 |
Юридическая лексика | 61.035 |
Юридическая лексика: англосакс. правовая система | 5 |
Ядерная физика | 134 |
Ядерная химия | 1 |
Япония | 1 |
Японский язык | 4 |
Hi-Fi акустика | 3 |
SAP технические термины | 4 |
SAP | 3 |
Всего: | 637.439 |
Фонетическое танго. Почему мы пишем фамилию квотербека «Майами» с «н» – First & Goal
Квотербек из университета Алабамы Tua Tagovailoa, выбранный на драфте НФЛ «Долфинс» под пятым общим номером, вот уже несколько месяцев живёт на нашем сайте под именем «Туа Танговаилоа».
Вопросы о том, откуда взялась эта «н», если её нет в оригинале, одолевают нас практически после каждого материала о Туа. Чтобы ответить на этот простой, но постоянно повторяющийся вопрос, надо сделать небольшое отступление.
Когда нам нужно передать иностранное имя на русский язык, мы можем использовать два приёма. Первый — это транслитерация, когда мы передаём букву в букву. Это простой, «машинный» способ. Работает, если перед вами какое-нибудь простое имя вроде Bernard. Но стоит взять что-то посложнее, получается жуткий кошмар.
Второй вариант — это практическая транскрипция. Если по-простому, то это вариант «как слышим, так и пишем». Eugene будет не «Евген» и не «Эуген», а Юджин.
Мне приходилось заниматься практической транскрипцией иностранных фамилий и до знакомства с американским футболом, но в том же европейском соккере всё несколько проще: есть определённые правила в каждом языке, придерживаться их несложно.
В Штатах — исторически эмигрантской стране — выходцев из разных языковых сред очень много. Потомки скандинавов, потомки французов, потомки африканцев — у всех свои языковые особенности, которые сталкиваются с реалиями английского языка и пытаются к ним адаптироваться.
При передаче имён и фамилий на русский язык First & Goal ориентируется на несколько вещей:
- официальная транскрипция имени-фамилии, которую даёт сам игрок, либо его команда;
- вслух произнесённые имя-фамилия в исполнении самого игрока;
- транскрипция и произношение имени-фамилии на специализированном сайте;
- произношение имени-фамилии в исполнении комментатора матчей НФЛ или НСАА.
Пока легендарный квотербек Бретт Фарв играл в НФЛ, новичка в мире американского футбола было легко вычислить по популярному вопросу: «Почему он Фарв, если в оригинале Brett Favre?».
Много людей произносит фамилию Фарва
Предки Фарва — французы. Из тех объяснений лингвистов, которые мне удалось найти, следует, что французское сочетание фонем «vr» не работает в английском языке и требует замены либо через добавление гласных (у других носителей фамилии Favre в Штатах это часто звучит как «Фейвер»), либо через перестановку букв местами, что и получилось в случае с этим конкретным Фарвом.
Указание на правильное произношение фамилии Бретта дано на его страничке в Википедии. Так же, как на страничке Туа, указано, как следует произносить его фамилию:
Tuanigamanuolepola «Tua» Tagovailoa (/ˌtʌŋoʊvaɪˈloʊə/ TUNG-oh-vy-LOA)
Туа Танговаилоа объясняет, как произносится его фамилия
Добро пожаловать в самоанский язык! Да, хоть Туа и родился на Гавайях, но его семья — самоанцы. А буква «G» в самоанском языке называется «nga».
И раз уж мы придерживаемся практической транскрипции, то должны писать «Фарв» и «Танговаилоа».
Это сложно не только для нас!
Студенты университета Алабамы страдают
За пять лет практики мы накопили солидный опыт в таком непростом упражнении, как транскрипция имён на русский язык. Каждый год, незадолго до драфта, мы штудируем фамилии всех более-менее известных студентов, чтобы задать адекватный стандарт с момента их появления в НФЛ.
Разумеется, на этом пути мы тоже допускали ошибки, которые исправляли уже позже, но лучше смириться с изменением, чем годами упрямо тащить за собой неправильный вариант.
Например, на драфт–2020 среди прочих заявлялись такие товарищи, как Sewo Olonilua, Charlie Taumoepeau, Mekhi Becton и Tyler Biadasz. Как их написать по-русски?
Я уверен, что в 2015 году мы бы написали «Сево Олонилуа», «Чарли Таумоепеау», «Мекхи Бектон» и «Тайлер Биадаш».
А вот как правильно: «Шейво Оланолуа», «Чарли Тоумопейя», «Мекай Бектон» и «Тайлер Бьядеш».
Напоследок вот ещё несколько примеров имён-фамилий бывших и действующих игроков, а также пары тренеров, которые произносятся не так, как пишутся.
Ndamukong Suh
Как кажется: Ндамуконг Су (когда он только пришёл в лигу, на отечественных форумах встречался и вариант «Сух»)
Как на самом деле: Эндамукон Су
Что за нафиг: «G» на конце имени глухая. Имена, которые начинаются с нескольких согласных, в английском языке требуют гласной в начале. Впрочем, и не только с нескольких согласных. Имя «Xavier», которое мы передаём как «Зейвьер», иногда произносится как «Экзейвьер».
Kevin Kolb
Как кажется: Кевин Колб
Как на самом деле: Кевин Коб
Что за нафиг: Это как «солнце», которое произносится «сонце». Правда, в карьере Коба не было практически ничего солнечного.
Nnamdi Asomugha
Как кажется: Ннамди Асомуга
Как на самом деле: Намди Асомуа
Что за нафиг: Аналогично случаю с Эндамуконом.
Tarvaris Jackson
Как кажется: Тарварис Джексон
Как на самом деле: Таварис Джексон
Что за нафиг: Первая «R» глухая. А вот передавать его как «Таварис» или «Теварис» — это уже вопрос, не имеющий однозначного решения.
Tyrod Taylor
Как кажется: Тайрод Тейлор
Как на самом деле: Тарод Тейлор
Что за нафиг: Сложно сказать, почему так, это вскрылось буквально два года назад. Сам квотербек — парень скромный, поэтому не придавал значения, но сказал об этом одноклубнику, а тот растрепал в прессе. Но даже местные комментаторы до сих пор говорят «Тайрод», поэтому мы не стали менять.
Tedy Bruschi
Как кажется: Теди Бруши… Брусчи? Браски?
Как на самом деле: Теди Бруски
Что за нафиг: Итальянская фамилия. Все эти сочетания «ch», «sch» очень коварные. Только кажется, что есть какой-то один вариант. Bruschi — Бруски, а Schiano — Шиано. Поди разбери.
Matt Leinart
Как кажется: Мэтт Лейнарт
Как на самом деле: Мэтт Лайнерт
Что за нафиг: А это немецкая. В немецком «ei» передаётся как «ай». Мы, конечно, привыкли к историческому варианту «Оппенгеймер» (пример транслитерации), но в НФЛ жил и работал Марти Шоттенхаймер.
Dirk Koetter
Как кажется: Дирк Коеттер
Как на самом деле: Дирк Каттер
Что за нафиг: Отец нынешнего координатора нападения «Атланты» — немец, но фамилия вроде бы голландского происхождения. Голландцы те ещё извращенцы по части произношения фамилий. Любители соккера соврать не дадут. Нападающий Dirk Kuyt в России был и «Кёйт» и «Кайт», и «Кяут».
Robert Saleh
Как кажется: Роберт Салех
Как на самом деле: Роберт Сале
Что за нафиг: Координатор защиты «Сан-Франциско» — сын ливанских эмигрантов. Фамилия досталась от французских колонизаторов. Поскольку имя уже современное, на американский манер, то оно «Роберт», а не «Робер».
Josh Doctson
Как кажется: Джош Доктсон
Как на самом деле: Джош Доксон
Что за нафиг: Обожаем глухие звуки.
Hjalte Froholdt
Как кажется: Рагнар Лотброк
Как на самом деле: Йелда Фрохолт
Что за нафиг: Одно слово — датчане.
Kyle Juszczyk
Как кажется: Кайл Ющук
Как на самом деле: Кайл Юзчек
Что за нафиг: Мы-то в славянских фамилиях понимаем поболее американцев, но иногда приходится идти на уступки их филологической лени. Пусть скажут спасибо, что Jakub Blaszczykowski и Wojciech Szczesny предпочли играть в соккер.
Tanoh Kpassagnon
Как кажется: Танох Кпассагнон
Как на самом деле: Тано Пассаньо
Что за нафиг: Рекордсмен НФЛ по глухим звукам.
Транслитерация фамилий при получении документов
Закон диктует свои нормы в отношении правильного оформления документации для выезда заграницу. Так обязательно необходимо осуществлять перевод фамилий на иностранные языки. Например, для поездки в Германию любому россиянину в паспорте для загранпоездок понадобится перевести фамилию на латиницу. На первый взгляд в этой процедуре нет ничего особенного, но кое-какие нюансы все же стоит учитывать.
Особенности транслитерации русских фамилий
Без перевода фамилии на латиницу невозможно получить загранпаспорт или визу, открывающую путь заграницу. Часто возникающие трудности при переводе вынудили чиновников разработать ряд конкретных правил, позволяющих проводить транслитерацию безошибочно.
Основное положение – это максимальная созвучность фамилии на латинском с исходным русским вариантом. Этими же правилами руководствуются при переводе данных иностранных подданных. При невозможности передать сложный звук одной латинской литерой, используется их сочетание.
Ранее перевод фамилий осуществлялся с помощью французского алфавита. После выбора английского, как опорного языка для транслитерации, многие специалисты стали отмечать сложность работы. Все дело в том, что фонетическая составляющая у данного языка весьма бедная, что затрудняет перевод.
Перевод фамилий – проблематика процесса
Спорных моментов у специалистов при работе возникает немало. Особенно остро этот вопрос становится при получении загранпаспорта, ведь в дальнейшем именно он будет служить основным документом для последующих транслитераций. Так, к примеру, звук «щ» принято передавать как буквосочетание «shch», а звук «х» — «kh». Именно отсутствие соответствующих латинских букв и можно назвать самым сложным моментом.
Еще одна проблемная деталь – не все учреждения учитывают написание фамилии из загранпаспорта, что угрожает владельцу рядом казусов:
- таможня – именно здесь нередко выявляют несоответствие написания фамилии в паспорте и билете, поэтому вояжеру приходится вернуться домой;
- эмиграция – при въезде в другую страну, с желанием получить ПМЖ, могут возникнуть недопонимания с местными управляющими органами;
- утрата документа – если госорганы РФ выявят ошибку в написании фамилии в любом документе (виза, паспорт, вид на жительство и пр.), то он тут же признается недействительным, что влечет за собой необходимость повторного получения документации.
Даже специалисты с многолетним опытом работы могут столкнуться со сложностями в переводе, а иногда и совершить ошибку. Поэтому каждый гражданин, имеющий в планах покинуть страну, должен самостоятельно обращать внимание на соответствие иностранного написания фамилии в собственном паспорте.
Математические модели систем транскрипции именно-фамильных групп
Аминева С.Н., Бондаренко А.В., Галактионов В.А., Горемычкин В.И., Клышинский Е.С., Н.Ж. Силаев и др., Практическая транскрипция имен собственных в языках мира (Наука, М., 2010).
Google Scholar
Сухотин А.М. О передаче зарубежных географических названий // Проблемы географии и картографии (Москва, 1935), т. 9, с.1. С. 144–145.
Google Scholar
Реформатский А.А., Введение в языкознание (Учпедгиз, М., 1955).
Google Scholar
Гиляревский Р.С., Старостин Б.А., Иностранные имена и наименования в русском тексте , Справочник, 3-е изд. (Высш. Школа, М., 1985).
Google Scholar
Д. И. Ермолович, Имена собственные: теория и практика перевода (Р. Валент, М., 2005).
Google Scholar
А.В. Бондаренко, Ю. Визильтер В., Клышинский Э.С., Клышинский Н.Ж. Силаев, “Нечеткий поиск имен собственных с использованием lk-представлений”, Программ. Prod. Систем, № 3 , 54–59 (2010).
Google Scholar
Р. Штейнбергер, «Объединение различных инструментов анализа текста для мониторинга многоязычных СМИ», в материалах Труды конференции Немецкого общества компьютерной лингвистики и языковых технологий GSCL (Гамбург, 2011 г.), № 96, сер. Б. С. 25–32.
Google Scholar
А.В. Бондаренко, Ю. Визильтер В., Горемычкин В. И., Клышинский Е. С. Формальный метод транскрипции иностранных имен собственных // Программирование.Prod. Систем. 2010. № 1. С. 147–152.
Google Scholar
М. Арбаби, С. М. Фишталь, В. К. Ченг и Э. Барт, «Алгоритмы транслитерации арабских имен», IBM J. Res. Dev. 38 , 183–194 (1994).
Артикул
Google Scholar
М. Дивай, А. Дж. Витале, «Алгоритмы перевода графема-фонема для английского и французского языков: приложения для поиска в базах данных и синтеза речи», Ж. вычисл.Лингвист. 23 , 495–523 (1997).
Google Scholar
К. Найт, Дж. Грель, «Машинная транслитерация», Comput. Лингвист. 24 , 599–612 (1998).
Google Scholar
Дж. Нури, Л. Пивоварова и Р. Янгарбер, «Модели на основе MDL для генерации транслитерации», в материалах Труды Международной конференции по статистическому языку и обработке речи SLSP 2013, Таррагона, Испания , 2013.
Google Scholar
Логачева В.К. Метод генерации правил межъязыковой транслитерации // Автоматика и телемеханика. Documentat. Математика. Лингвист. 45 , 239–248 (2011).
Артикул
Google Scholar
Я. Шернер и О. Рамбоу, «Идентификация диалектов на основе слов с пространственно привязанными правилами», в материалах Труды конференции 2010 года по эмпирическим методам обработки естественного языка, Шроудсбург , 2010, стр.1151–1161.
Google Scholar
N. Ingle, A Language Identification Table (Tech. Translation Int., Лондон, 1980).
Google Scholar
Р. Жегуржек и М. Колкус, «Идентификация языка в Интернете: расширение словарного метода», в материалах Труды 10-й Международной конференции по компьютерной лингвистике и интеллектуальной обработке текста CICLing 2009, Мехико , 2009 , стр.357–368.
Google Scholar
К. Инин, Ю. Цзяли, К. Мин, З. Юн и В. Цзиньлинь, «Определение языкового происхождения имен людей с помощью n-граммов различных единиц», в Proceedings of the IEEE International Конференция по акустике, обработке речи и сигналов, Тулуза , 2006 г., стр. 729–732.
Google Scholar
С. Чен и Б. Мейсон, «Использование данных географических названий для обучения языковых моделей идентификации», в Proceedings of the Eurospeech, Geneva , 2003, pp.1349–1352.
Google Scholar
Ф. Хуанг, С. Фогель и А. Вайбель, «Кластеризация и классификация имен людей по происхождению», в материалах Труды 20-й Национальной конференции по искусственному интеллекту, Питтсбург , 2005 г., том. 3. С. 1056–1061.
Google Scholar
Варианты фамилий | findmypast.com
Дэниел М. Линча, автор GoogleYourFamilyTree.ком
От записей переписи до списков пассажиров и записей об иммиграции и натурализации — многие из наших любимых источников семейной информации охватывают различные варианты написания, почерка и аббревиатуры. Поскольку эти исторические коллекции были оцифрованы и расшифрованы, современные технические специалисты, возможно, изо всех сил пытались правильно интерпретировать и сохранить запись, сделанную в давние времена.
Для энтузиастов семейной истории в Соединенных Штатах проблема с вариациями имен особенно актуальна, поскольку мы являемся нацией иммигрантов и их потомков.Зная больше о вариантах имени , обоих именах, называемых , с учетом имен , и фамилиях, известных как фамилии , вы будете лучше подготовлены, чтобы предвидеть проблемы и использовать правильную стратегию, чтобы найти человека, которого вы » повторно ищем. Существуют три общие категории, которые влияют на варианты имен — альтернативное написание фамилий, сокращения имен и ошибки транскрипции.
История фамилий — Альтернативные варианты написания
Существует широко распространенный среди семейных историков миф, который часто используется для объяснения вариантов написания фамилий, известных как фамилии: « Правительство изменило имя на острове Эллис, » или так рассказывается история.По правде говоря, списки пассажиров составлялись в порту отправления, а не по прибытии, и нет ни одного задокументированного случая изменения фамилии на острове Эллис.
Многие варианты написания фамилий развивались на протяжении многих поколений и различаются от одной этнической группы к другой. Языковые барьеры, грамотность и желание считаться американцем вскоре после прибытия, вероятно, являются причиной многих альтернативных написаний, используемых сегодня.
В некоторых случаях варианты написания простые и тонкие (например,грамм. — Phalen пишется как Phelan), в других случаях удаление пробела или изменение одной буквы также может показаться простым, но иметь большое влияние (например, — La Sorda, Lasorda, Lo Sardo, Losardo). Даже некоторые члены одной семьи использовали разные варианты написания (например, О’Рурк против Рурка).
Совет по поиску: Можно использовать односимвольные подстановочные знаки для соответствия этим вариантам имен во время поиска (например, — L? S? Rd? Захватит Ласорда и Лосардо). Если ваше семейно-историческое исследование включает одну или несколько фамилий, склонных к нескольким вариантам написания, подумайте, как вы можете использовать подстановочные знаки или продвинутые фильтры поиска, чтобы найти этих предков.
Варианты имени — Сокращения
Сокращения чаще встречаются в связи с именами, а не с фамилиями. Несмотря на отсутствие установленных стандартов, большинство сокращений легко интерпретируются. Однако некоторые имена имеют более одного варианта, что затрудняет поиск в онлайн-индексе без использования какой-либо формы подстановочного знака или другого фильтра для захвата всех возможных вариантов.
Например: Уильям часто обозначается сокращенно как Wm, Томас как Thos или Том, Патрик как Pat или Patk или Patr, Дэниел как Dan или Danl или Дэнни, Маргарет как Мэгги, Элизабет как Бет или Элиза.При поиске предка помните, что точный поиск данного имени может непреднамеренно скрыть предка из поля зрения, если в исходной записи или транскрипции использовалось сокращение.
Совет по поиску: Попробуйте использовать подстановочный знак (например, — Pa *), чтобы найти любое имя, начинающееся с «Pa», за которым следует любая комбинация букв. Это будет работать для многих, но не для всех сокращений (например, — Лиззи как сокращение от Элизабет).
Ошибки транскрипции
Помимо уже обсужденных альтернативных написаний и сокращений, один непреднамеренный источник вариаций имени связан с ошибками нажатия клавиш, сделанными в процессе транскрипции.Переписывая семейно-исторические записи, технические специалисты стремятся сохранить содержимое в том виде, в котором оно представлено в историческом оригинале. Несмотря на все усилия, ошибки все же возникают, и имена могут быть непреднамеренно изменены. Если эта ошибка возникает для ведущей буквы имени или фамилии предка, это может иметь еще более существенное влияние при сокрытии записи от просмотра.
Если вы столкнулись с трудностями при поиске предка, особенно если ваш поиск не дал результатов, обязательно изучите возможности расширенного поиска и возможности поиска по шаблонам.
Совет по поиску: Выполните поиск, используя другую информацию о человеке, но оставив поле имени и фамилии пустыми.
Вот инструкции по предоставлению данных в JewishGen Данные, отправляемые менеджерам баз данных JewishGen, должны быть в С файлами текстового процессора труднее работать, чем с электронными таблицами. Во всех случаях убедитесь, что каждое поле в вашей базе данных I. Шаблоны Менеджер каждого проекта транскрипции должен создать запись данных Шаблоны для определенных стандартных типов записей можно найти на
II.Ввод данных Все данные должны быть расшифрованы как можно точнее. Если транскрибер или редактор базы данных желает добавить предположения,
III.Сгруппированные записи Некоторые источники, такие как записи переписи населения, царские ревизионные списки и т. Д., Например, вот входная электронная таблица, содержащая две семейные группы:
, который может отображаться как:
Здесь мы используем столбец «Семейство №» в качестве поля «склеить», чтобы склеить Обратите внимание, как общие поля (данные, общие для каждого члена Поле «клей» также необходимо для того, чтобы гарантировать, что весь Например, показанный выше экран будет результатом поиска Самое простое использование поля «клей» — это запись о браке — Также обратите внимание, что поле «клей» не обязательно является отображаемым полем. IV. Транслитерация JewishGen установил универсальные стандарты транслитерации нет Вот несколько общих идей и рекомендаций:
V. «Иные фамилии», |
Руководства | ScotlandsPeople
Справочная информация
Почему различается написание фамилий
Как использовать параметры поиска по фамилии
Фамилии в Шотландии
Дополнительная литература по фамилиям
Справочная информация
Это руководство посвящено фамилиям и способам эффективного поиска по фамилии в записях, индексированных по личному имени. Он дает вам некоторую справочную информацию о развитии фамилий в Шотландии, расскажет вам общие причины, по которым у фамилий есть вариации или написание фамилий иногда не то, что вы могли ожидать.Он дает вам советы о том, как использовать параметры поиска по фамилии, чтобы улучшить поиск.
Почему фамилии пишутся по-разному
Способы написания фамилий в разных записях различались, и при поиске человека в наших указателях написание могло отличаться от ожидаемого. Это может быть связано с одним или несколькими из следующих факторов:
- Ошибка транскрипции при индексировании
- орфографические ошибки, фонетические орфографические ошибки или иное неверное толкование регистраторами и служащими
- умышленное или случайное введение информаторов в заблуждение
- варианта фамилии
- члены семьи могли изменить свою фамилию после эмиграции из Шотландии или англизировать имя по прибытии в Шотландию
- семьи из Хайленда и Западных островов могли преобразовать свою гэльскую фамилию на английский язык, например, MacIan на Johnston.
Как использовать параметры поиска по фамилии
Если вы не уверены в написании фамилии или подозреваете, что имя могло быть записано иначе, вы можете использовать «Параметры поиска по фамилии», чтобы улучшить свой поиск. Вот способы использования параметров поиска:
Оставьте поле фамилии пустым
Вы можете оставить поле фамилии пустым и искать, используя только имя или другие поля поиска.
Только точные имена
Если вы выберете «Только точные имена», будут возвращены все записи, содержащие полное имя для поиска, поэтому поиск по фамилии DOUGLAS, например, вернет все записи DOUGLAS.Также возвращаются имена через дефис, такие как MONTAGU-DOUGLAS и DOUGLAS-HOME. Варианты написания имени для поиска и частичные совпадения (когда имя для поиска включается в более длинное имя), например DOUGLASS, не возвращаются.
Нечеткое соответствие
Нечеткое сопоставление сравнивает каждое слово в искомом имени с каждым словом в именах в указателе с использованием формулы расстояния Левенштейна. Результат, равный половине числа букв в слове или больше, считается совпадением.Расстояние Левенштейна — это метрика для измерения количества различий между двумя последовательностями (так называемое расстояние редактирования).
Имена, начинающиеся на
Если вы выберете «Имена, которые начинаются с», он вернет все совпадения, которые начинаются с букв поиска, а ДУГЛАС, например, вернет ДУГЛАСС.
Варианты названия
Если вы выберете «Варианты имени», поиск будет расширен за счет сравнения списка вариантов для каждого имени на сайте ScotlandsPeople.Эти данные собирались на протяжении многих лет сотрудниками Национального центра учета рекордов Шотландии и Шотландии, часто на основе предложений клиентов. В списке вариантов имени не делается различий между фамилией и именем (потому что многие имена могут быть одинаковыми), поэтому поиск CLARE (в зависимости от других поисковых фильтров) может вернуть CLAIR, CLAIRE и SINCLAIR. Список находится в стадии разработки, и новые варианты предлагаются часто. Мы понимаем, что варианты имен могут быть спорной темой и, как и другие параметры поиска, функция поиска «Имя варианты» поможет с некоторых поисков, а не с другими.
Фонетическое соответствие
Фонетическое сопоставление — это попытка иметь дело с вариациями написания одного и того же слова, особенно личных имен, на основе комбинации букв, представляющих звуки. Он основан на фонетическом алгоритме, чтобы предложить возможные варианты одного и того же слова. На сайте ScotlandsPeople мы используем систему фонетического сопоставления Бейдера-Морзе (иногда сокращенно BMPM). Для получения дополнительной информации об этом посетите веб-сайт Стива Морса.
Подстановочные знаки разрешены
Если вы выберете «Подстановочные знаки разрешены», это позволит вам использовать символы для поиска вариантов символов в слове.
- Заменить ноль или более символов звездочкой (*) или знаком процента (%)
- Замените вопросительный знак (?) Или подчеркивание (_) только на один символ
Эти символы могут быть заменены в любом месте фамилии или имени и могут использоваться в различных комбинациях. Однако вы должны стараться использовать подстановочные знаки как можно более конкретно, чтобы не возвращать ненужные объемы данных. Вот несколько советов по использованию подстановочных знаков:
- Поиск по шаблону для фамилии по-прежнему будет возвращать записи с дополнительными именами и те, в которых выбранное имя появляется как второе или последующее имя.
- Если фамилия могла быть записана с написанием, предполагающим только одно изменение буквы, например, SMITH записано как SMYTH или CALLISON записано как CALLISON, вы можете найти полезным использовать подстановочный знак вопросительного знака (?), Чтобы найти их.
- Будьте осторожны при использовании подстановочного знака звездочки (*) в конце фамилии. Например, BRYD * найдет любые имена, начинающиеся с BRYD, такие как BRYDON, BRYDAN, но также BRYDENTON, BRYDALL и BRYDSON.
- Если фамилия Mc могла быть записана как Mac или наоборот, используйте подстановочный знак звездочки (*), чтобы найти ее.Например, M * CDONALD или M * CDONALD найдет записи как MCDONALD, так и MACDONALD.
- Вы можете использовать несколько подстановочных знаков в одном поиске, например, поиск по M * CGIL * V? R * Y вернет множество вариантов фамилии; MCGILVERY, MCGILLVERY, MCGILIVARY, MCGILLIVARY, MCGILLIVERY, MCGILLIVERAY, MCGILVARAY, MCGILVAREY, MCGILVARY, MCGILVEREY и т. Д. Вместе с версиями для Mac.
- Записи в поле фамилии должны содержать минимум два символа, но ни один из них не может быть подстановочным знаком.Например, M *, * M не будут приняты, но M * M, MA * или * MA принимаются.
Фамилии в Шотландии
Постоянные фамилии начали использоваться в Шотландии примерно в 12 веке, но первоначально они были прерогативой высших эшелонов шотландского общества. Однако постепенно возникла необходимость отличать обычных людей друг от друга не только по имени и распространению использования шотландских фамилий. Однако в некоторых районах Хайленда фиксированные фамилии не стали нормой до 18 века, а в некоторых частях Северных островов — до 19 века.
Влияния на шотландские фамилии многочисленны и разнообразны, и часто более чем одна приводит к фамилии, которую мы знаем сегодня. Поэтому очень трудно с полной уверенностью указать источники фамилий, хотя есть много книг по теме происхождения фамилий, которые пытаются сделать именно это. Вот лишь некоторые из элементов, которые, как считается, способствовали появлению нынешних фамилий:
Иностранные влияния на шотландские фамилии
Внешние влияния сыграли решающую роль в формировании фамилий в Шотландии.Миграция шотландцев из Ирландии на юго-запад в V веке, способствовавшая распространению гэльского языка и культуры, влияние местных пиктов, поселение бриттов в Стратклайде и английские иммигранты в Лотиане и на приграничных территориях — все это внесло свой вклад. к плавильному котлу фамилий, который у нас есть сегодня.
Скандинавы в результате своих сезонных набегов и последующей колонизации Западных и Северных островов оставили позади аспекты своего наследия и языка, которые не в последнюю очередь сохраняются в фамилиях этих областей, например, Ганн происходит от норвежского языка и фигурирует в значительной части. числа на севере Шотландии.Скандинавское влияние можно увидеть и в других частях Шотландии, например, Торберн — это старое скандинавское имя, которое встречается на шотландских границах и вокруг Эдинбурга.
Влияние норманнов проникло в Шотландию после их вторжения в Англию и активно поощрялось шотландскими королями. Англо-нормандская знать приобрела в дар земли вокруг Шотландии и ввела феодальную систему землевладения. Например, Роберт Брюс был потомком Роберта де Брюса, который сражался с Вильгельмом Завоевателем в битве при Гастингсе.Биссетт, Бойл, Колвилл, Корбетт, Гиффорд, Хэй, Киннер и Фрейзер — все изначально нормандские имена, впервые появившиеся в Шотландии в 12 веке. Мензис и Грэм — общепризнанные англо-нормандские фамилии, которые также впервые были замечены в Шотландии в это время.
Продолжая в более поздние времена, влияние ирландской иммиграции в 19 веке можно увидеть в фамилиях, используемых в настоящее время в Шотландии, например, Дейли или Дейли — это ирландское имя, производное от O’Dalaigh , и концентрации можно найти в районы, где селились ирландские иммигранты, вокруг Глазго и Данди.Это подтверждается записями: очень мало людей с такой фамилией фигурирует в OPR, но значительное число фигурирует в установленных законом реестрах. Такие имена, как Дочерти и Галлахер, теперь довольно распространенные в Шотландии, также появились относительно недавно.
Фамилии по месту нахождения
Многие из первых постоянных фамилий имеют территориальное происхождение, поскольку землевладельцы стали известны по названиям земель, которыми они владели, например Мюррей из земель Морей и Огилви, который, по словам Блэка, происходит от баронства Огилви. в приходе Гламис, Ангус.Арендаторы, в свою очередь, могли принять или получить имя своего домовладельца, несмотря на то, что не имели с ним родства.
Профессиональные фамилии
Значительное количество фамилий происходит от занятий их владельцев. Некоторые из них очевидны, например Смит, Портной, Мейсон и другие могут быть менее очевидными, например, Бакстер (пекарь), Стюарт (стюард), Уордроп (хранитель) одежды феодального двора) и Вебстера (ткачиха). Кординер, Саутар и Грассик произошли от слова «сапожник», а последнее — от гэльского «сапожник», greusaich .
Отчество
Многие шотландские фамилии произошли от отчества, при этом фамилия сына происходит от имени отца, например, сыном Джона Дональдсона может быть Питер Джонсон, чьим сыном может быть Магнус Петерсон, и так далее. Отчество представляет собой проблему для семейного историка, поскольку фамилия менялась с каждым последующим поколением.
Эта практика исчезла в Низменной Шотландии после 15 века, когда отчества стали постоянными фамилиями.Однако он сохранялся на Высокогорье и на островах вплоть до 18 века (см. Фамилии Мак) и на Северных островах до 19 века.
Эта система применялась и к именам дочерей: девочка принимала отцовское имя, а в конце имени указывалось дочери . Суффикс дочери обычно сокращался в записях, например, дочь Джанет Адамс становится Джанет Адамсдаур, или Адамсдр, или Адамсд. Запись из Lerwick OPR в 1734 году четко иллюстрирует влияние отчества на рождение / крещение Уильяма Лоуренсона Лауру.Эразмусон и Кэтрин Николлсдр.
Ола Кристоферсоне
Sinevo Matchis dochter
Mac Фамилии
Mac — это префикс к фамилии гэльского происхождения, означающий сын . Например, Macdhomhnuill переводится как Macdonald, что означает сын Дональда.
Вы можете встретить женский вариант Nc , аббревиатуру nighean mhic или дочь Mac , прикрепленную к женской фамилии и иногда сокращенную до N ‘.В старых приходских книгах есть много примеров, особенно в 17 и 18 веках, например, Ncfarlane, Ncdonald, Ncdearmit, Ncfee, но есть только отдельные примеры к началу 19 века.
В более ранних записях человек мог быть известен не только по имени отца, но и по имени деда. Таким образом, вы можете встретить использование Vc , что означает внук или внучку, например, в 1673 году Дугалл Макдугалл Вчан (Дугалл, сын Дугалла, внук Эана) женился на Мари Камрон или NcNdonochie Vcewn.
Некоторые фамилии Mac произошли от профессий, например Macnab (сын аббата), Maccosh (сын лакея), Macmaster (сын мастера или священнослужителя), Macnucator (сын wauker или ткача), позже англизированные Уокер. Другие происходят от отличительных черт, например Macilbowie (сын желтоволосого парня), Macilchrum (сын согнутого). Тем не менее, другие содержат остатки норвежского влияния, например Макивер (сын Ивара, личное скандинавское имя), поскольку приставка Mac не была исключительной префиксом гэлов, а в некоторых случаях была принята норвежцами и некоторыми низменными шотландцами, в частности на периферии Хайленда, например Macgibbon, Macritchie.
Многие фамилии Mac больше не используются, например, Macolchallum , были заброшены, потому что их было слишком трудно произносить, они были искажены с годами фонетическим написанием или англизированы.
Фамилии Mac также записывались как Mc , Mhic или M ’. Фамилии Mc / Mac индексируются в базе данных отдельно, но очень часто можно найти фамилию одного и того же человека, зарегистрированную как Mc в одной записи, а Mac — в другой, поэтому всегда следует проверять обе.Использование подстановочного знака звездочки (*) вернет обе версии за один поиск, например, M * CDONALD получит записи как MCDONALD, так и MACDONALD.
Ronald m [a] cdonald v [i] c Ean
T [estament] d [ative] Джанет Фрейзер, псевдоним Нейн Донилл Вик Роби
Обратите внимание, что в некоторых статьях указателя есть досадный разрыв между Mc / Mac и остальной частью имени. Персонал исправит их по мере их обнаружения, и любые клиенты, обнаружившие их, должны сообщать нам о них как об ошибках индекса.Чтобы попытаться учесть их в результатах поиска, клиентам следует попробовать такие параметры поиска, как подстановочные знаки.
Родовые фамилии
Это распространенное заблуждение, что те, кто носит фамилию клана, автоматически происходят от главы клана. Способность клана защищать свою территорию от других кланов во многом зависела от привлечения как можно большего числа последователей. Членство в большом и могущественном клане стало явным преимуществом в беззаконном нагорье, и последователи могли принять название клана, чтобы выслужиться перед Лэрдом, продемонстрировать солидарность, для базовой защиты или потому, что их земли были захвачены более сильным соседом и у них было мало вариантов! Третьи присоединились к клану, пообещав столь необходимое пропитание.
И наоборот, не все члены клана использовали фамилию клана. Когда клан Грегора был запрещен в 1603 году, многие Макгрегоры были вынуждены принять другие фамилии, например Грант, Стюарт, Рамзи. Когда в 18 веке клан снова был запрещен, Роб Рой Макгрегор принял имя своей матери Кэмпбелл. После того, как запрет был снят в 1774 году, некоторые вернулись к имени Macgregor, а другие — нет.
Последствия эмиграции и миграции
Многие эмигранты из Шотландии сменили имена по прибытии в новую страну, как и многие люди с высокогорья и островов, которые мигрировали в низменности Шотландии в поисках работы.Укорочение или удаление префикса Mc или Mac , или перевод гэльской фамилии на английский язык, или вообще изменение фамилии на похожую по звучанию английскую, которая будет легче произноситься и скроет ваше происхождение, были довольно распространенными явлениями. Таким образом, гэльская фамилия Макдоннчайд или Макдонахи становится Дункансоном, Мэйсиан становится Джонсоном, Макдональд англизируется до Дональдсона, Макилрой становится Милроем, а Маккоуэн становится Коуэном. Гэльский Mac Ghille dhuibh , или сын темнокожего парня, упоминаемый в фамилиях Macilduy, Macildue и Macildowie, переводится как Black.Гилкрист, гэльское имя, означающее «слуга Христа», могло быть переведено на английский язык для Кристофера. Однако неграмотность может привести к смене фамилии по умолчанию, что приведет к появлению странных и замечательных вариантов, например, Маклахлан, записанный как Макглауфлин.
Кое-имя или Т-имя
То-имена или Т-имена, означающие «другие имена» или прозвища, были широко распространены, особенно в рыбацких общинах Северо-Восточной Шотландии, но также были замечены в Приграничье и, в меньшей степени, в Западном Хайлендсе.
В тех областях, где использовалось относительно небольшое количество фамилий, к имени добавлялись Т-имена, чтобы различать людей с одинаковой фамилией и именем. Прозвище могло относиться к отличительной особенности или быть названием рыбацкой лодки, на которой работал человек. Эти Т-имена вошли в записи. Например, среди многочисленных Джонов Коуи из Баки можно найти рыбака Джона Коуи Морковь , который женился на Изабелле Джеппи из Каллена в 1892 году.Может быть, это отсылка к цвету его волос?
Имя T появляется на странице результатов, установленных законом, в скобках, чтобы отличать его от второго имени, например, Джеймс (Рози) Коуи, Джеймс (Буллен) Коуи, Джесси (Гайк) Мюррей, и может быть обозначено в кавычках на изображение фактической записи.
Раннее написание может отличаться от более позднего
Вы можете найти в более старых записях, что Quh и Wh взаимозаменяемы, например, White может быть записан как Quhit , Quhytt , Quhyitt , Quhetit , Quheyt , Quhyte и скоро.Macwatt может быть записан как Macquhat . Ch или ck могут быть опущены с конца фамилии, например Tulloch отображается как Tullo во многих более ранних записях, Tunnock как Tunno . Очень часто можно найти e , добавленное в конец фамилий в более ранних записях (например, Robertsone для Робертсона, Pearsone для Пирсона) или что w и u являются взаимозаменяемыми (например, , Gowrlay для Gourlay или Crauford для Crawford), или u , вставляемый в фамилии, заканчивающиеся на на или один (например, Cameroun для Cameron, Robertsoun или Roberts) для .Такие имена, как Моррисон, могут быть представлены как Morison , аналогично Ker для Керра. Фамилия, оканчивающаяся на y , может быть заменена на e , как в Murray и Murrie . Букву i можно заменить на y , как в Kidd и Kydd .
Дополнительная литература по фамилиям
Для получения дополнительной информации о происхождении шотландских фамилий полезны следующие книги:
Блэк, Джордж Ф. «Фамилии Шотландии: их происхождение, значение и история» (Эдинбург: Бирлинн, 1999 г., перепечатано в 2004 г., впервые опубликовано Нью-Йоркской публичной библиотекой, 1946 г.) — рассматривается как основная работа по происхождению фамилий.
Дорвард, Дэвид, «Шотландские фамилии» (Глазго: HarperCollins, 1995) — карманная книга, в которой основное внимание уделяется фамилиям, используемым в настоящее время в Шотландии. Это особенно полезно для информации о концентрации фамилий.
Учебное пособие
% PDF-1.6
%
3 0 obj
>
эндобдж
27 0 объект
> поток
приложение / pdf
2000-07-06T10: 45: 38Z2016-10-13T14: 37: 49 + 01: 002016-10-13T14: 37: 49 + 01: 00Acrobat PDFWriter 3.02 для Windows NTuuid: 8b80a2f3-57d8-4890-a05f-5c370dc09ddduuid: 06565113-e8c5-4b0a-8eac-b19a067f5623
конечный поток
эндобдж
5 0 obj
>
эндобдж
4 0 obj
> / ProcSet 2 0 R >> / Тип / Страница >>
эндобдж
18 0 объект
> / ProcSet 2 0 R >> / Тип / Страница >>
эндобдж
21 0 объект
> / ProcSet 2 0 R >> / Тип / Страница >>
эндобдж
24 0 объект
> / ProcSet 2 0 R >> / Тип / Страница >>
эндобдж
25 0 объект
> поток
D
как были созданы наши фамилии
Процесс переноса старых гэльских фамилий на английский был запутанным и на удивление долгим.Еще в 19 веке в некоторых приходских книгах по-прежнему ведутся записи о происходящих изменениях за определенный промежуток времени.
В западном Корке дети, которых крестили как «Фоулоу» ( Ó Foghlú , из foghlaí , «грабитель») в 1820-х годах стали «Фаули» в 1830-х годах и, наконец, «Фоули» в 1840-х годах. В Литриме членами одной семьи являются сначала «Брехени» (от Mac an Bhreitheamhan , «сын судьи»), затем «Судья» и, наконец, да поможет нам Бог, «Авраам», вырванный из «МакАбрахана». .
Эти два примера иллюстрируют наиболее распространенные способы англицирования фамилий, фонетическую транскрипцию и перевод, причем оба почти всегда рассматривают префикс O или Mc как неуместные. Результаты могут быть приблизительными и готовыми, приблизительными версиями того, что, по мнению регистратора, он слышал или вообразил, что он понял.
Отрыв от Ó Murchú («внук морского пса») до «Мерфи» всегда казался мне слишком далекой фонемой.Поскольку любой англоязычный регистратор, знавший ирландский язык, имел лишь поверхностное знание, неправильный перевод был правилом, а не исключением. Mac Conraoi (запад Голуэя), Mac Fhearadhaigh (Ориэль), Ó Maol Conaire (Роскоммон) и Ó Conraoi (восточная часть Голуэя) — все закончилось как «король» на английском языке просто потому, что они содержат элементы это для неискушенного уха звучит как rí , «король».
Но самым большим оскорблением старых фамилий была перестановка.Ленивый или рассерженный регистратор откажется от каких-либо претензий на перевод или фонетическую транскрипцию и просто выберет английскую фамилию, которая имеет некоторое сходство с ирландским оригиналом. Сходство часто было отдаленным: «Брэдли» за Ó Brolacháin ; «Харрингтон» за hIongardáil ; «Голландия» за Ó Maol Challann ; «Давенпорт» за Ó Доннуарт .
За три столетия до обретения независимости наблюдался большой приток английских и шотландских семей, среди которых, без сомнения, было множество настоящих Брэдли, Харрингтонов, Холландов и Давенпортов.
В качестве справочника по этническому происхождению фамилии в Ирландии действительно могут быть очень коварными.
irishtimes.com/ancestor
Перевод и транслитерация китайских имен с китайского на английский
Транслитерация китайских имен на Тайване
На Тайване подавляющее большинство тайваньцев сегодня латинизируют свои имена на мандаринском произношении, используя Wades-Giles или аналогичную систему, которую можно легко отличить от Hanyu Pinyin, используемой для латинизации в материковом Китае и Сингапуре, по отсутствию использования « q »,« zh »и« x »путем использования« hs »и включения дефисов между двумя частями имени.В отличие от материкового Китая, латинизация имен на Тайване не стандартизирована, и часто можно встретить идиосинкразические варианты, такие как Lee или Soong, среди других. Сначала идет фамилия, за ней следуют имена. Два имени разделяет дефис, а второе имя никогда не пишется с заглавной буквы. Хорошим примером служат имена двух из шести последних президентов Тайваня:
蔡英文 Tsai Ing-wen
馬英九 Ma Ying-jeou
陳水扁 Chen Shui-bian
李登輝 Lee Teng-hui
蔣經國 Chiang Ching-kuo
嚴家淦 Yen Chia-kan
Однако есть тайваньцы, которые используют английские имена, и когда это делается, необходимо использовать их английское имя в переводе, а не транслитерацию китайского.
Leave a Reply