Как многие замечали, английская письменность вообще плохо ложится на их язык. Например, нет нормальной системы, чтобы отмечать долготу гласной.
Поэтому было много проектов ввести в английский нормальный фонетический алфавит.
https://en.wikipedia.org/wiki/Initial_Teaching_Alphabet
https://www.theguardian.com/education/2025/jul/06/1960s-schools-experiment-created-new-alphabet-thousands-children-unable-to-spell
Поэтому было много проектов ввести в английский нормальный фонетический алфавит.
https://en.wikipedia.org/wiki/Initial_Teaching_Alphabet
https://www.theguardian.com/education/2025/jul/06/1960s-schools-experiment-created-new-alphabet-thousands-children-unable-to-spell
🔥32✍7❤3❤🔥1👎1👏1🫡1
Forwarded from Лингвистические истории
Как климатические условия влияют на язык?
Учёные из Нью-Мексико на протяжении трех лет изучали фонетические характеристики около 1000 мировых языков и анализировали климат, вычисляли зависимости.
Вот к чему пришли:
➡️ в жарких регионах с повышенной влажностью люди используют больше гласных звуков в речи: языки Нигерии (йоруба, игбо): до 60% гласных в речи, включая назализованные варианты;
➡️ в высокогорных областях коренные жители очень любят взрывные согласные — "п,б,т,д,к,г" и их мягкие варианты. Всё просто: в разреженном воздухе высокогорий (от 2500 м) сложно произносить звонкие фрикативные звуки (в, з, ж), требующие длительного выдоха. Взрывные (п, т, к) экономнее — для них хватает короткого импульса воздуха.
➡️ во влажных зонах мира люди пользуются более широким диапазоном тембров;
➡️ холодный климат = упрощение артикуляции: в саамских языках (Скандинавия) нет шипящих (ж, ш) и губных согласных (в, ф) ;
🦢 Но не все учёные согласны с описанием фонетики через климатический детерминизм:
➡️ Миграции, завоевания, СМИ нивелируют климатические эффекты (пример: испанский одинаков в горах Перу и прибрежной Испании).
➡️ Статистические погрешности: исследование университета Нью-Мексико охватило лишь 20% языков мира .
➡️ Обратная причинность: возможно, языки развились ДО массовых миграций в экстремальные зоны.
Учёные из Нью-Мексико на протяжении трех лет изучали фонетические характеристики около 1000 мировых языков и анализировали климат, вычисляли зависимости.
Вот к чему пришли:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤3
Forwarded from Ну как сказать
День новостей про тибетский язык!
Коллеги из Новосибирского государственного университета сообщают: их студентка, Анна Мурашкина, создала приложение для распознавания, оцифровки, анализа и транслитерации классических тибетских текстов с применением машинного обучения.
Система ориентирована на старопечатные документы, выполненные с использованием тибетского слогового письма (восходит к древнеиндийскому письму брахми). Для разработки приложения Анна использовала изображения страниц классических тибетских текстов XVIII-XX веков из архива Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН.
Исследовательница поставила перед собой задачу — с применением машинного обучения построить модель, которая распознавала бы символы тибетского алфавита с изображений, переводила в машиночитаемый вид и все это — точнее, чем существующие открытые решения, в том числе Tesseract.
Дообучение модели она реализовала на размеченном корпусе документов, и в результате создала полный модульный алгоритм OCR, включающий этапы предобработки, сегментации, распознавания и постобработки.
Разработку будут использовать сотрудники Института монголоведения, буддологии и тибетологии СО РАН. Также обсуждается возможность сотрудничества с Буддистским центром цифровых технологий, который проводит оцифровку архивов храмов и монастырей.
Прекрасно же?
Коллеги из Новосибирского государственного университета сообщают: их студентка, Анна Мурашкина, создала приложение для распознавания, оцифровки, анализа и транслитерации классических тибетских текстов с применением машинного обучения.
Система ориентирована на старопечатные документы, выполненные с использованием тибетского слогового письма (восходит к древнеиндийскому письму брахми). Для разработки приложения Анна использовала изображения страниц классических тибетских текстов XVIII-XX веков из архива Центра восточных рукописей и ксилографов Института монголоведения, буддологии и тибетологии СО РАН.
Актуальность моей работы обусловлена необходимостью сохранения и цифровой доступности тибетского культурного наследия, представленного в виде множества исторических рукописей. Старопечатные документы, рукописи и ксилографы содержат уникальные сведения о философии, религии, медицине, истории и искусстве, играя ключевую роль в изучении культурных традиций региона. Эти знания передаются в Тибете из поколения в поколение.
Однако со временем, под воздействием природных и антропогенных факторов, бумажные носители подвержены физическому разрушению, что ведет к утрате бесценной информации и ограничивает доступ к этим уникальным материалам. В настоящее время в Тибетском фонде Института монголоведения, буддологии и тибетологии СО РАН хранится до 70 тысяч единиц хроники, которые рискуют быть утерянными. Один из наиболее надежных способов сохранения и систематизации исторических документов — их оцифровка, — рассказала Анна Мурашкина.
Исследовательница поставила перед собой задачу — с применением машинного обучения построить модель, которая распознавала бы символы тибетского алфавита с изображений, переводила в машиночитаемый вид и все это — точнее, чем существующие открытые решения, в том числе Tesseract.
Для этого я вручную выполнила лингвистическую разметку строк тибетского текста из фонда ИМБТ СО РАН. Затем с учетом специфики тибетской графики разработала систему оценки качества оптического распознавания символов. Далее я провела сравнение существующих архитектур и выбрала модель сверточной нейросети, которая потребовала дообучения, — поясняет Анна.
Дообучение модели она реализовала на размеченном корпусе документов, и в результате создала полный модульный алгоритм OCR, включающий этапы предобработки, сегментации, распознавания и постобработки.
Разработку будут использовать сотрудники Института монголоведения, буддологии и тибетологии СО РАН. Также обсуждается возможность сотрудничества с Буддистским центром цифровых технологий, который проводит оцифровку архивов храмов и монастырей.
Прекрасно же?
❤37👍4
Forwarded from shtyrbu_name
КАЗНИТЬ НЕЛЬЗЯ ПОМИЛОВАТЬ
В английском есть свои аналоги “казнить нельзя помиловать” — устоявшиеся примеры, на которых демонстрируют важность пунктуации.
Так, в нулевых — после выхода одноимённой книги-бестселлера — популярной стала фраза “eats shoots and leaves”. Отсылает она к анекдоту:
В XIX веке тему тоже объясняли с юмором — при помощи детского стишка (он и по сей день мелькает в справочниках и статьях):
С проставленным знаками это “Карл первый ходил и говорил, а через полчаса ему отрубили голову”, без знаков — “Карл первый ходил и говорил через полчаса после того, как ему отрубили голову”.
А вот в XVII веке нравы были суровее. Никаких хиханек да хаханек — учили по Библии. Например, в учебнике The English Primrose (1644 г.) рассматривается отрывок из притчи Соломона:
Если запятую поставить не после not, а перед, смысл будет противоположным:
Вот такое вот “казнить нельзя помиловать” на максималках, где на кону даже не тело, а душа.
В английском есть свои аналоги “казнить нельзя помиловать” — устоявшиеся примеры, на которых демонстрируют важность пунктуации.
Так, в нулевых — после выхода одноимённой книги-бестселлера — популярной стала фраза “eats shoots and leaves”. Отсылает она к анекдоту:
Панда заходит в бар, заказывает сэндвич, съедает его, а потом выхватывает пистолет и палит в потолок. После чего убирает оружие в кобуру и вальяжно направляется к выходу.
— Эй, ты что творишь? — кричит ошарашенный бармен.
Медведь, который уже было дошёл до двери, останавливается, поворачивается, вытаскивает книгу и бросает её человеку.
— На, читай.
Книга оказывается потрёпанной энциклопедией о животных. Бармен находит нужную страницу, а там информация про панду дана с опечаткой — вместо “eats shoots and leaves” (ест побеги и листья) написано “eats, shoots and leaves” (ест, стреляет и уходит).
В XIX веке тему тоже объясняли с юмором — при помощи детского стишка (он и по сей день мелькает в справочниках и статьях):
Charles the First walked and talked[;]
Half an hour after[,] his head was cut off.
С проставленным знаками это “Карл первый ходил и говорил, а через полчаса ему отрубили голову”, без знаков — “Карл первый ходил и говорил через полчаса после того, как ему отрубили голову”.
А вот в XVII веке нравы были суровее. Никаких хиханек да хаханек — учили по Библии. Например, в учебнике The English Primrose (1644 г.) рассматривается отрывок из притчи Соломона:
My Son, if sinners intise [entice] thee consent thou not, refraining thy foot from their way.
Сын мой, если будут склонять тебя грешники, не соглашайся, удержи ногу твою от стези их.
Если запятую поставить не после not, а перед, смысл будет противоположным:
My Son, if sinners intise thee consent thou, not refraining thy foot from their way.
Сын мой, если будут склонять тебя грешники, соглашайся, не удержи ногу твою от стези их.
Вот такое вот “казнить нельзя помиловать” на максималках, где на кону даже не тело, а душа.
❤27🔥9👍4⚡2😁1😱1😢1
Forwarded from Агентство. Новости
«Хлопок» разрушил 10 этажей многоквартирного дома в Саратове
Взрыв разрушил подъезд 10-этажного многоквартирного дома в Саратове, свидетельствуют видео с места происшествия. Погибли три человека, сообщила пресс-служба МЧС. Произошедшее ведомство назвало «хлопком».
Цитата. «По предварительной информации, в квартире по улице Блинова, 2 произошел хлопок газовоздушной смеси без последующего горения. От этого разрушился угловой подъезд с 7 по 10 этажи. Погибли 3 человека», — говорится в сообщении.
▪️ТАСС со ссылкой на оперативные службы сообщил, что в доме произошло обрушение с 10-го по 1-й этажи. Среди погибших есть ребенок, под завалами подъезда могут находиться люди, уточняет агентство.
▪️По факту взрыва газа в жилом десятиэтажном доме в Саратове возбуждено уголовное дело об оказании услуг, не отвечающих требованиям безопасности.
Подпишитесь на «Агентство»
Взрыв разрушил подъезд 10-этажного многоквартирного дома в Саратове, свидетельствуют видео с места происшествия. Погибли три человека, сообщила пресс-служба МЧС. Произошедшее ведомство назвало «хлопком».
Цитата. «По предварительной информации, в квартире по улице Блинова, 2 произошел хлопок газовоздушной смеси без последующего горения. От этого разрушился угловой подъезд с 7 по 10 этажи. Погибли 3 человека», — говорится в сообщении.
▪️ТАСС со ссылкой на оперативные службы сообщил, что в доме произошло обрушение с 10-го по 1-й этажи. Среди погибших есть ребенок, под завалами подъезда могут находиться люди, уточняет агентство.
▪️По факту взрыва газа в жилом десятиэтажном доме в Саратове возбуждено уголовное дело об оказании услуг, не отвечающих требованиям безопасности.
Подпишитесь на «Агентство»
💊19😨8❤🔥2👎1👏1🤩1
Forwarded from Однажды в Википедии
Когда твоя задача автора электронной музыки сломать Википедию максимально безумным использование Unicode в названии песен.
https://en.wikipedia.org/wiki/Four_Tet_discography
https://en.wikipedia.org/wiki/Four_Tet_discography
🔥23🤣6👍5❤2🤩2🐳1
Forwarded from Грузия внутри | Georgia Inside
Грузинская каллиграфия от Nino Khetsuriani
❤🔥28🔥18❤5🐳2
Forwarded from папа хуху
черновик Нанкинского договора
Это черновик англо-китайского договора, подписанного в Нанкине в 1842 году, после Первой опиумной войны.
Тут мне, конечно же, очень не хватает знаний по оформлению делового вэньяня. Поэтому, вместо того, что бы что рассказывать, я скорее напишу список моих любопытствований:
大皇帝 - “Великий Император” пишется всегда с красной строки в вертикальном исполнении. И, кстати, красной строки наоборот - то есть, он вынесен вперед, а не утоплен назад.
英国君主 - “Английский самодержец” (да, я знаю, что это была королева, но оставлю все в мужском роде) всегда пишется так, что после слова 英国 “Англия” строка обрывается, а следующая начинается со слова 君主 “самодержец”, при этом от 英国 до 君主 идет длинная соединительная линия. Также важно отметить, что 君主 “самодержец” не вынесено в красную строку.
Это черновик англо-китайского договора, подписанного в Нанкине в 1842 году, после Первой опиумной войны.
Тут мне, конечно же, очень не хватает знаний по оформлению делового вэньяня. Поэтому, вместо того, что бы что рассказывать, я скорее напишу список моих любопытствований:
大皇帝 - “Великий Император” пишется всегда с красной строки в вертикальном исполнении. И, кстати, красной строки наоборот - то есть, он вынесен вперед, а не утоплен назад.
英国君主 - “Английский самодержец” (да, я знаю, что это была королева, но оставлю все в мужском роде) всегда пишется так, что после слова 英国 “Англия” строка обрывается, а следующая начинается со слова 君主 “самодержец”, при этом от 英国 до 君主 идет длинная соединительная линия. Также важно отметить, что 君主 “самодержец” не вынесено в красную строку.
❤16❤🔥4
