Telegram Web Link
Встреча в Apple HQ 25 июня 2025 состоялась!

Провёл около часа с инженерами команды интернационализации Apple. Спасибо им за такую возможность!

Мы обсудили клавиатурную поддержку для кириллических языков. Как первый шаг — нам необходимо разработать дизайн клавиатуры для Российской Федерации, где будут доступны все наши буквы из расширенной Кириллицы. Данная логика такая же, как у английской раскладки, где остальные латинские буквы доступны через долгое нажатие. Это позволит быстро внедрить в систему наши буквы, а клавиатура РФ (на базе Русского языка) будет более мощной и гибкой.

Сразу начинаем собирать данные о частотности букв для обоснования этого дизайна. Успеем ли мы к Дню языков народов России?

Что касается индивидуальных клавиатур для языков, у меня есть стратегия — расскажу о ней чуть позже. Эти клавиатуры очень важны, ведь для каждого языка необходимо собрать словари, правила, голосовые данные и т.д. Эти технологии за пределами прямой ответственности команды разработки клавиатур.

На фото – Герман, iOS разработчик клавиатур.
13❤‍🔥6🔥1💩1
Media is too big
VIEW IN TELEGRAM
Тут девушка готовит парня к поездке в Киров.

Во-первых, жители Кирова, это правда?

Во-вторых, какие прикольные штуки есть у вас в регионах.

Например, у нас не знают, что помидор — мужского рода. У нас это "помидора", ну на крайний случай — помидорка.

Спасибо подписчику за крутое видео — присылайте ещё @yazycozisthebest
😁26🔥9
Хотите лингвистический шок-контент? Я вам принесла.

Есть у нас слово фейсконтроль — ограничение входа, выборочный отказ в обслуживании посетителей (клиентов), не удовлетворяющих определённым критериям. Наверное, даже те, кто не владеет английским, примерно представляет, как это слово образовалось: от английского face, то есть «лицо», ну и control, он же «контроль», тут все прозрачно.

Но если мы посмотрим на это слово в словаре английского языка, то там будет пометка: заимствовано из русского. Что? Да.

В английском языке такого термина действительно не было. Русский заимствовал из английского не концепцию целиком, а два отдельных слова face и control (ну или, если хотите, только facе — «контроль» у нас и самих уже был), слепил их вместе для обозначения всем известного процесса и радостно начал использовать. И уже из русского face control как единое словосочетание проникает в английский и употребляется в том же значении.

Такие вот лексические приключения.
😱42👍217🔥5😁4👏1
Forwarded from Канал Кулича
Из древнего выпуска региональных новостей, оцифрованных на канале mrcatmann, узнал, что в конце 90-х в Татарстане планировали законодательно перевести татарский язык на латиницу, но в 2004-м Конституционный суд запретил им и остальным национальным республикам в составе РФ менять алфавит.
👍16🫡8🌚32👌2👎1😭1🤝1
Снимаю шляпу: явно потребовались десятилетия упорной работы, чтобы так развёрнуто на канцелярите написать простое «в доме отключат электричество»!
🔥18🤬17🌚9😁72❤‍🔥1🙏1
Forwarded from Ряды Фурье
У нас знакомый китаец, которого зовут Дитя Прогресса. По жизни он Паша, а не Женя (Джин), потому что ему понравился Павел Корчагин. Ещё одну знакомую зовут Интеллигентная Ласточка — это на китайском, по-русски она Дуня. Есть прекрасная Нефритовый Лес. Были Добрыня и Аня из Владивостока, потому что Добрыня знает, что это хороший человек, а Ане нравится звучание. Они хорошо готовили окрошку и карман из сухаря, что бы это ни значило.

На днях встретился водитель Наташа. Он уверен, что это отлично звучащее имя, и для него оно очень даже мужское. Наташа весит под 95 килограмм, поэтому возражать никто не думает.

Так вот, китайцы часто выбирают местные имена в той стране, куда они переехали. Так, чтобы местным было привычнее и понятнее. Это помогает.

А вот научная работу по тому, как именно они выбирают имя — Е. М. Спиваковой "Русские имена китайских студентов в аспекте межкультурной коммуникации".

— Китайцам неприятно, когда их родные имена коверкают. Русским людям сложно запоминать и правильно произносить китайские имена. Русское имя упрощает общение.
— Выбор русского имени — это шаг к пониманию русской культуры, своего рода игра, которая помогает адаптироваться.
— Когда всех твоих друзей зовут русскими именами, легче разобраться в этой путанице. Александр — Саша — Шура, это же вообще ад, надо заучивать. И вообще сначала надо пол определить. А ещё ведь потом фамилия.

Как выбирают:
— Красиво звучит — это главный мотив для большинства (57%). Причем "красота" может быть субъективной (один студент выбрал имя Симон, а Семён отверг, считая его женским). Другой парень отклонил имена Иван, Александр, Андрей, потому что они кажутся ему "недостаточно мужественными" или "труднопроизносимыми", и остановился на имени Максим, которое звучит для него более подходяще.
— Похоже на китайское имя: примерно 11,5% выбирают имя, которое хоть немного созвучно их китайскому имени или фамилии. Например, девушка с фамилией Ли выбрала имя Лилия. Илинь выбрала имя Елена. Ди выбрала имя Дина. Ван может взять имя Анна, потому что совпадает "ан". Цзы может взять Лиза или Зоя. Достаточно одного-двух общих звуков или слогов, чтобы имя показалось более знакомым или легким для принятия.
— Понравилось значение имени: около 10% обращают внимание на значение. Остальные чаще узнают значение уже после выбора.
— Посоветовал преподаватель: примерно 9% просто соглашаются с вариантом, предложенным учителем, потому что в группе уже был один Женя.

Дальше большинство справляются, но часто путают Р и Л. Не все знают полные формы своих имён, многие (особенно если у имени нет стандартного краткого варианта) не могут назвать краткую форму. Большинству нравится, когда их называют русским именем, они воспринимают это с радостью, как игру.

Самые частые мужские имена китайцев в группах: Павел, Юрий, Николай, Андрей. Женские — Светлана, Наталья, дальше разнобой, потому что девушкам не нравится, когда у кого-то уже есть такое имя.

Так что будете во Владивостоке, заходите на рынок Китай-город, там много китайцев с родными именами. Возможно, даже получится встретить Добрыню.

--
Вступайте в ряды Фурье! А я е в степени икс!
🔥266❤‍🔥31
Как многие замечали, английская письменность вообще плохо ложится на их язык. Например, нет нормальной системы, чтобы отмечать долготу гласной.

Поэтому было много проектов ввести в английский нормальный фонетический алфавит.

https://en.wikipedia.org/wiki/Initial_Teaching_Alphabet
https://www.theguardian.com/education/2025/jul/06/1960s-schools-experiment-created-new-alphabet-thousands-children-unable-to-spell
🔥3273❤‍🔥1👎1👏1🫡1
Как климатические условия влияют на язык?

Учёные из Нью-Мексико на протяжении трех лет изучали фонетические характеристики около 1000 мировых языков и анализировали климат, вычисляли зависимости.

Вот к чему пришли:

➡️в жарких регионах с повышенной влажностью люди используют больше гласных звуков в речи: языки Нигерии (йоруба, игбо): до 60% гласных в речи, включая назализованные варианты;

➡️в высокогорных областях коренные жители очень любят взрывные согласные — "п,б,т,д,к,г" и их мягкие варианты. Всё просто: в разреженном воздухе высокогорий (от 2500 м) сложно произносить звонкие фрикативные звуки (в, з, ж), требующие длительного выдоха. Взрывные (п, т, к) экономнее — для них хватает короткого импульса воздуха.

➡️во влажных зонах мира люди пользуются более широким диапазоном тембров;

➡️холодный климат = упрощение артикуляции: в саамских языках (Скандинавия) нет шипящих (ж, ш) и губных согласных (в, ф) ;

🦢 Но не все учёные согласны с описанием фонетики через климатический детерминизм:

➡️Миграции, завоевания, СМИ нивелируют климатические эффекты (пример: испанский одинаков в горах Перу и прибрежной Испании).

➡️Статистические погрешности: исследование университета Нью-Мексико охватило лишь 20% языков мира .

➡️Обратная причинность: возможно, языки развились ДО массовых миграций в экстремальные зоны.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥173
День новостей про тибетский язык!

Коллеги из Новосибирского государственного университета сообщают: их студентка, Анна Мурашкина, создала приложение для распознавания, оцифровки, анализа и транслитерации классических тибетских текстов с применением машинного обучения.

Система ориентирована на старопечатные документы, выполненные с использованием тибетского слогового письма (восходит к древнеиндийскому письму брахми). Для разработки приложения Анна использовала изображения страниц классических тибетских текстов XVIII-XX веков из архива Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН.

Актуальность моей работы обусловлена необходимостью сохранения и цифровой доступности тибетского культурного наследия, представленного в виде множества исторических рукописей. Старопечатные документы, рукописи и ксилографы содержат уникальные сведения о философии, религии, медицине, истории и искусстве, играя ключевую роль в изучении культурных традиций региона. Эти знания передаются в Тибете из поколения в поколение.

Однако со временем, под воздействием природных и антропогенных факторов, бумажные носители подвержены физическому разрушению, что ведет к утрате бесценной информации и ограничивает доступ к этим уникальным материалам. В настоящее время в Тибетском фонде Института монголоведения, буддологии и тибетологии СО РАН хранится до 70 тысяч единиц хроники, которые рискуют быть утерянными. Один из наиболее надежных способов сохранения и систематизации исторических документов — их оцифровка, — рассказала Анна Мурашкина.


Исследовательница поставила перед собой задачу — с применением машинного обучения построить модель, которая распознавала бы символы тибетского алфавита с изображений, переводила в машиночитаемый вид и все это — точнее, чем существующие открытые решения, в том числе Tesseract.

Для этого я вручную выполнила лингвистическую разметку строк тибетского текста из фонда ИМБТ СО РАН. Затем с учетом специфики тибетской графики разработала систему оценки качества оптического распознавания символов. Далее я провела сравнение существующих архитектур и выбрала модель сверточной нейросети, которая потребовала дообучения, — поясняет Анна.


Дообучение модели она реализовала на размеченном корпусе документов, и в результате создала полный модульный алгоритм OCR, включающий этапы предобработки, сегментации, распознавания и постобработки.

Разработку будут использовать сотрудники Института монголоведения, буддологии и тибетологии СО РАН. Также обсуждается возможность сотрудничества с Буддистским центром цифровых технологий, который проводит оцифровку архивов храмов и монастырей.

Прекрасно же?
37👍4
Forwarded from shtyrbu_name
КАЗНИТЬ НЕЛЬЗЯ ПОМИЛОВАТЬ

В английском есть свои аналоги “казнить нельзя помиловать” — устоявшиеся примеры, на которых демонстрируют важность пунктуации.

Так, в нулевых — после выхода одноимённой книги-бестселлера — популярной стала фраза “eats shoots and leaves”. Отсылает она к анекдоту:

Панда заходит в бар, заказывает сэндвич, съедает его, а потом выхватывает пистолет и палит в потолок. После чего убирает оружие в кобуру и вальяжно направляется к выходу.

— Эй, ты что творишь? — кричит ошарашенный бармен.

Медведь, который уже было дошёл до двери, останавливается, поворачивается, вытаскивает книгу и бросает её человеку.

— На, читай.

Книга оказывается потрёпанной энциклопедией о животных. Бармен находит нужную страницу, а там информация про панду дана с опечаткой — вместо “eats shoots and leaves” (ест побеги и листья) написано “eats, shoots and leaves” (ест, стреляет и уходит).


В XIX веке тему тоже объясняли с юмором — при помощи детского стишка (он и по сей день мелькает в справочниках и статьях):

Charles the First walked and talked[;]
Half an hour after[,] his head was cut off.


С проставленным знаками это “Карл первый ходил и говорил, а через полчаса ему отрубили голову”, без знаков — “Карл первый ходил и говорил через полчаса после того, как ему отрубили голову”.

А вот в XVII веке нравы были суровее. Никаких хиханек да хаханек — учили по Библии. Например, в учебнике The English Primrose (1644 г.) рассматривается отрывок из притчи Соломона:

My Son, if sinners intise [entice] thee consent thou not, refraining thy foot from their way.

Сын мой, если будут склонять тебя грешники, не соглашайся, удержи ногу твою от стези их.


Если запятую поставить не после not, а перед, смысл будет противоположным:

My Son, if sinners intise thee consent thou, not refraining thy foot from their way.

Сын мой, если будут склонять тебя грешники, соглашайся, не удержи ногу твою от стези их.


Вот такое вот “казнить нельзя помиловать” на максималках, где на кону даже не тело, а душа.
27🔥9👍42😁1😱1😢1
«Хлопок» разрушил 10 этажей многоквартирного дома в Саратове

Взрыв разрушил подъезд 10-этажного многоквартирного дома в Саратове, свидетельствуют видео с места происшествия. Погибли три человека, сообщила пресс-служба МЧС. Произошедшее ведомство назвало «хлопком».

Цитата. «По предварительной информации, в квартире по улице Блинова, 2 произошел хлопок газовоздушной смеси без последующего горения. От этого разрушился угловой подъезд с 7 по 10 этажи. Погибли 3 человека», — говорится в сообщении.

▪️ТАСС со ссылкой на оперативные службы сообщил, что в доме произошло обрушение с 10-го по 1-й этажи. Среди погибших есть ребенок, под завалами подъезда могут находиться люди, уточняет агентство.

▪️По факту взрыва газа в жилом десятиэтажном доме в Саратове возбуждено уголовное дело об оказании услуг, не отвечающих требованиям безопасности.

Подпишитесь на «Агентство»
💊19😨8❤‍🔥2👎1👏1🤩1
Когда твоя задача автора электронной музыки сломать Википедию максимально безумным использование Unicode в названии песен.

https://en.wikipedia.org/wiki/Four_Tet_discography
🔥23🤣6👍52🤩2🐳1
2025/10/19 23:35:48
Back to Top
HTML Embed Code: