2023ʼ во джынся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 3:39 22.06.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Восстановление коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
2.2. Выборочный перевод  с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса.
2.3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
2.4. Перевод с русского языка на коми язык стабильных текстов официальных сайтов администрации и совета МОГО "Сыктывкар" и     выравнивание коми и русских эквивалентов по предложениям в программе WinMerge.
2.5. Перевод на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
2.6. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" (части 1 и 2, 2017 г.) и "Коми язык. 6 класс" (2018), обработка текстов (разбивка по предложениям, сортировка, устранение повторов) в программе LibreOffice Writer, выравнивание коми и русских эквивалентов в программе WinMerge и включения в базу параллельных текстов на коми и русском языках.
2.7. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
2.8. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.
2.9. Локализация интерфейса desktop приложения менеджера Telegram на коми язык и начало локализации iOs и Android приложений менеджера Telegram.
2.10. Предварительная работа по локализации интерфейса браузера Mozilla FireFox на коми язык.
2.11. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    
2.12. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики. Вычленение русскоязычного новостного массива  за 2018 г., корректирование русского текста за 2017 год, обработка файла с коми текстом за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы; вычитка и корректирование новостных текстов "Радио Коми гор" за 2017, 2019 и 2020 гг., маркировка повторных сообщений для последующего удаления из общего массива.
2.13. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года; аналогичная работа произведена с текстом учебника "Л. Г. Терехова, В. Г. Эрдели. География : учебник для четвертого класса начальной школы" (1938) с разбивкой на предложения и выравниванием данного текста с коми переводом издания 1939 года  для параллельного корпуса.
2.14.  Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940),  "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Водопьянов. Полярнӧй лётчик" (1958), "В.  Ардаматский. Ме 11-17" (1963), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951).
2.15. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.
2.16. Создание коми локали для операционной системы Simply Linux.
2.17. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

Объём параллельного корпуса коми языка на 2023-06-22 составляет 1 271 069 выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954), С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953), "Н. Островский. Бушколын чужысьяс" (1957), "В. Каверин. Мужестволӧн школа" (1957), "И. Кожедуб. Служита Рӧдиналы" (1957), "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963), "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
3.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий"М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948),   "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1955), "С. Григорьев. Малахов курган" (1952),  "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958).
3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52;  2023. №1-24) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023. №1-3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.4. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка на 2023-06-22 составляет 78 267 824 словоупотребления.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 51 номера газеты "Југыԁ туј" за (1925-02-14,  1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07), 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14, 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, 1925-05-23, 1925-05-27,  1925-05-30,  1925-06-02,  1925-06-04, 1925-06-06 (приложение "Комі ԍікт"),  1925-06-11, 1925-06-13, 1925-06-16, 1925-06-18, 1925-06-20,  1925-06-23, 1925-06-25, 1925-06-27, 1925-06-30, 1925-07-04 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

Объём молодцовского корпуса на 2023-06-22 составляет 2 527 906 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Заключение лицензионных договоров с правообладателями текстов авторов Раевский Степан Семенович, Касеева Клавдия Андреевна и Габов Прокопий Валентинович, вычитка, корректировка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений данных авторов.
5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна.
5.3. Размещение в коми онлайн библиотеке «Коми гижӧд» аудиоматериала к текстам произведений Г. И. Попова.
5.4. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 51 номеров газеты "Југыԁ туј" в переводе на современную графику.

Количество текстов в библиотеке на 2023-06-22 составляет 15492 единиц.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание авторской wiki-страницы и библиографии текстов авторов Габов П. В и Касеева К. А., Анна Кучева, размещение ссылок на произведения, размещенные в библиотеке "Коми гижӧд".
6.2. Пополнение библиографии текстов автора Карманова К. И. на wiki-странице автора, добавление ссылок на новые произведения, размещенные в библиотеке "Коми гижӧд".
6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)", "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)", "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)", "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)",  "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)", "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)",  "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)"
6.4. Создание и заполнение wiki-страниц с оглавлением по 51 номеру газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".
6.5. Создание перечня коми поэм и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
6.6. Пополнение таблицы по комиязычным изданиям книгами за 2022 и 2023 гг.

7. Создание мультиязычного корпуса по пермским языкам:

7.1. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.
7.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940), "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933), "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934), "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк)" (1941), "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941) для корпуса удмуртского языка и мультиязычного корпуса.

8. Помощь коллегам в регионах:

8.1. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате телеграм канала "Языков много — код один".
8.2. Создание справочного вики-ресурса по удмуртской письменности.
8.3. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности на основе каталогов РНБ.

8. Пополнение лексической базы FU-Lab:
 
8.1. Редактирование и размещение материала коми-русского и русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
9.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Иное.

12.1. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.  
12.2. Подборка текстов всех коми поэм для анталогии текстов данного жанара по просьбе Союза писателей Республики Коми.

13. Участие в мероприятиях:  

13.1. Участие в мероприятии "Ӧтувъя коми диктант".  
13.2. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).
13.3. Участие в подготовке выставки ДДН. ??????????????

 

2023ʼ вося мӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:52 21.06.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Восстановление коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
2.2. Выборочный перевод  с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса.
2.3. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" (части 1 и 2, 2017 г.) и "Коми язык. 6 класс" (2018), обработка текстов (разбивка по предложениям, сортировка, устранение повторов) в программе LibreOffice Writer, выравнивание коми и русских эквивалентов в программе WinMerge и включения в базу параллельных текстов на коми и русском языках.
2.4. Завершение работы по переводу на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
2.5. Продолжение работы с  текстами новостного массива радио "Коми гор": вычленение русскоязычного новостного массива  за 2018 г., корректирование русского текста за 2017 год, обработка файла с коми текстом за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы; вычитка и корректирование новостных текстов "Радио Коми гор" за 2017, 2019 и 2020 гг., маркировка повторных сообщений для последующего удаления из общего массива.
2.6. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года; аналогичная работа произведена с текстом учебника "Л. Г. Терехова, В. Г. Эрдели. География : учебник для четвертого класса начальной школы" (1938) с разбивкой на предложения и выравниванием данного текста с коми переводом издания 1939 года  для параллельного корпуса.
2.7. Первичное выравнивание по предложениям в программе WinMerge коми текстов с русскоязычным эквивалентом для параллельного корпуса по изданиям "М. Водопьянов. Полярнӧй лётчик" (1958), "В.  Ардаматский. Ме 11-17" (1963), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951), с русскими эквивалентами и их включение в базу параллельных текстов на коми и русском языках.
2.8. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.
2.9. Создание коми локали для операционной системы Simply Linux.
2.10. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

Объём параллельного корпуса коми языка за отчетный период возрос на 55187 единиц и к 2023-06-22 составляет 1 271 069 выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: "Н. Островский. Бушколын чужысьяс" (1957), "В. Каверин. Мужестволӧн школа" (1957), "И. Кожедуб. Служита Рӧдиналы" (1957), "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963), "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
3.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1955), "С. Григорьев. Малахов курган" (1952),  "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958).
3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №12-24) и журнала "Йӧлӧга" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.4. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 292433 единицы и к 2023-06-22 составляет 78 267 824 словоупотребления.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 21 номера газеты "Југыԁ туј" за 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14, 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, 1925-05-23, 1925-05-27,  1925-05-30,  1925-06-02,  1925-06-04, 1925-06-06 (приложение "Комі ԍікт"),  1925-06-11, 1925-06-13, 1925-06-16, 1925-06-18, 1925-06-20,  1925-06-23, 1925-06-25, 1925-06-27, 1925-06-30, 1925-07-04 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

Объём молодцовского корпуса за отчетный период возрос на 76713 единицы и к 2023-06-22 составляет 2 527 906 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Заключение лицензионного договора с правообладателем текстов автора Раевский Степан Семенович.
5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Раевский Степан Семенович.
5.3. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 21 номера газеты "Југыԁ туј" в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на 693 единицы и к 2023-06-22 составляет 15492 текста.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)",  "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)", "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)",  "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)" и автору "Анна Кучева".
6.2. Создание и заполнение wiki-страниц с оглавлением по 21 номеру  газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".
6.3. Пополнение таблицы по комиязычным изданиям книгами за 2022 и 2023 гг.

7. Создание мультиязычного корпуса по пермским языкам

7.1. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.
7.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940), "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933), "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934), "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк)" (1941), "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941) для корпуса удмуртского языка и мультиязычного корпуса.

8. Помощь коллегам в регионах:

8.1. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате телеграм канала "Языков много — код один".
8.2. Создание справочного вики-ресурса по удмуртской письменности.
8.3. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности на основе каталогов РНБ.

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
9.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Участие в мероприятиях:

12.1. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).
Участие в подготовке выставки ДДН. ??????????????

2023ʼ лӧддза-номъя тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 14:32 21.06.2023

25.05.2023–23.06.2023.

  1.  
  2. Продолжение работы по восстановлению коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Продолжение вычитки и корректирования новостных текстов "Радио Коми гор" за 2019 и 2020 гг., маркировка повторных сообщений для последующего удаления из общего массива.
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№20-24); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Добавление в корпус коми языка и параллельный русско-коми корпус обработанных в текущем месяце материалов, обновление корпусов.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-13, 1925-06-16, 1925-06-18, 1925-06-20, 1925-06-23, 1925-06-25, 1925-06-27, 1925-06-30, 1925-07-04 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933), "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934), "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк)" (1941), "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941) для корпуса удмуртского языка и параллельных корпусов.
  9. Создание справочного вики-ресурса по удмуртской письменности.
  10. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности.
  11. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.
  12. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)" и автору "Анна Кучева".
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Участие в подготовке выставки ДДН.
FU-Lab. 2023.06.19.-2023.06.23

опубликовал Öньö Лав в 14:07 21.06.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.06.19.-2023.06.23.
 

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Корректирование новостных текстов радио "Коми гор" за 2020 год.
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№23, 24); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Добавление в корпус коми языка и параллельный русско-коми корпус обработанных в текущем месяце материалов, обновление корпусов.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-07-04 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941) для корпуса удмуртского языка и параллельных корпусов.
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)" и автору "Анна Кучева".
  10. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.06.12.-2023.06.16.

опубликовал Öньö Лав в 22:55 15.06.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.06.12.-2023.06.16.
    

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Продолжение корректирования новостных текстов радио "Коми гор" за 2019 год.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №22); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-27, 1925-06-30, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) удмуртских переводов учебника: "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк) : неполной средней но средней школалы 6-тӥ класслы учебник " (1941) для корпуса удмуртского языка и параллельных корпусов.
  8. Создание справочного вики-ресурса по удмуртской письменности.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  12. Участие в подготовке выставки ДДН.
FU-Lab. 2023.06.05.-2023.06.09.

опубликовал Öньö Лав в 23:58 08.06.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.06.05.-2023.06.09.

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса ru-kv.
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-23, 1925-06-25, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  5. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) удмуртских переводов учебника: "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934) для корпуса удмуртского языка и параллельных корпусов.
  6. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.
  7. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023.05.29.-2023.06.02.

опубликовал Öньö Лав в 19:47 01.06.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.05.29.-2023.06.02.

 

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Продолжение выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса.
  4. Продолжение вычитки и корректирования новостных текстов "Радио Коми гор" за 2017 г., маркировка повторных сообщений для последующего удаления из корпуса.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-18, 1925-06-20, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) удмуртских переводов учебника: "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933) для корпуса удмуртского языка и параллельного корпуса.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №21); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.05.22.-2023.05.26.

опубликовал Öньö Лав в 20:50 25.05.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.05.22.-2023.05.26.

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Вычитка и корректирование новостных текстов "Радио Коми гор" за 2017 и 2019 гг., маркировка повторных сообщений для последующего удаления из корпуса.
  4. Завершение перевода на русский язык комиязычных фраз и выражений из учебника  "Коми язык. 6 класс" (2018) для корпуса параллельных текстов.
  5. Начало выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-13, 1925-06-16,их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940) для корпуса удмуртского языка и параллельного корпуса.
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №20); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Создание коми локали для операционной системы Simply Linux.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ ода-кора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 14:12 24.05.2023

25.04.2023–24.05.2023.

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: "Н. Островский. Бушколын чужысьяс" (1957), "В. Каверин. Мужестволӧн школа" (1957), "И. Кожедуб. Служита Рӧдиналы" (1957), "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader издания "А.  Мусатов. Гӧра йылын керка" (1950), проверка  орфографии, обработка распознанного текста в программе LibreOffice Writer и его первичное выравнивание в программе WinMerge с  русскоязычным квивалентом для параллельного корпуса.
  4. Распознавание и вычитка в программе ABBYY FineReader текстов переводных изданий на коми языке "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958), обработка распознанных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "Л. Г. Терехова, В. Г. Эрдели. География : учебник для четвертого класса начальной школы" (1938), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года  для параллельного корпуса.
  6. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940) для корпуса удмуртского языка и параллельного корпуса.
  7. Первичное выравнивание по предложениям в программе WinMerge коми текстов с русскоязычным эквивалентом для параллельного корпуса по изданиям "М. Водопьянов. Полярнӧй лётчик" (1958), "В.  Ардаматский. Ме 11-17" (1963).
  8. Завершение работы по переводу на русский язык комиязычных фраз и предложений  учебников "Коми язык. 5 класс" (части 1 и 2, 2017 г.), "Коми язык. 6 класс" (части 1 и 2, 2018 г.) и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  9. Вычитка и корректирование новостных текстов "Радио Коми гор" за 2017 и 2019 гг., маркировка повторных сообщений для последующего удаления из корпуса.
  10. Начало выборочного перевода с русского языка на коми язык новостных текстов федеральных средств массовой информации для параллельного корпуса.
  11. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Раевский Степан Семенович. Заключение лицензионного договора с правообладателем.
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)", "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)".
  13. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-21, 1925-05-23, 1925-05-27,  1925-05-30,  1925-06-02,  1925-06-04 и 1925-06-06 (приложение "Комі ԍікт"),  1925-06-11, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  14. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №16-19); и журнала "Йӧлӧга" (2003. №4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  15. Создание коми локали для операционной системы Simply Linux.
  16. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  17. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  18. Распространение комиязычного контента в соц. сетях.
  19. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  20. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).
FU-Lab. 2023.05.15.-2023.05.19.

опубликовал Öньö Лав в 9:48 19.05.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.05.15.-2023.05.19.

  1.  
  2. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  3. Вычитка и корректирование новостных текстов "Радио Коми гор" за 2017 и 2019 гг., маркировка повторных сообщений для последующего удаления из корпуса.
  4. Продолжение перевода на русский язык комиязычных фраз и выражений из учебника  "Коми язык. 6 класс" (2018) для корпуса параллельных текстов.
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №18, 19) и журнала "Йӧлӧга" (2003. №4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: Н. Островского "Бушколын чужысьяс" (1957) и В. Каверина "Мужестволӧн школа" (1957).
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)".
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-11, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.05.10.-2023.05.12.

опубликовал Öньö Лав в 0:26 12.05.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.05.10.-2023.05.12.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводного книжного  издания на коми языке  "И. Кожедуб. Служита Рӧдиналы" (1957) и создание его электронной копии в формате pdf.
  3. Первичное выравнивание в программе WinMerge коми текста с  русскоязычным эквивалентом для параллельного корпуса по изданию "В.  Ардаматский. Ме 11-17" (1963).
  4. Продолжение перевода на русский язык комиязычных фраз и выражений из учебника  "Коми язык. 6 класс" (2018) для корпуса параллельных текстов.
  5.  Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-06-04 и 1925-06-06 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  7. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  8. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Houston, we have a problem

опубликовал Öньö Лав в 11:30 11.05.2023

Перестал работать определитель лемм: https://fu-lab.ru/lemms

FU-Lab. 2023.05.02.-2023.05.05.

опубликовал Öньö Лав в 12:54 04.05.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.05.02.-2023.05.05.

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader текстов переводных изданий на коми языке "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958), обработка распознанных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Первичное выравнивание по предложениям в программе WinMerge коми текста с русскоязычным эквивалентом для параллельного корпуса по изданию "М. Водопьянов. Полярнӧй лётчик" (1958).
  4. Вычитка и корректирование новостных текстов "Радио Коми гор" за 2017 год, маркировка повторных сообщений для последующего удаления из корпуса.
  5. Продолжение перевода на русский язык комиязычных фраз и выражений из учебника  "Коми язык. 6 класс" (2018) для корпуса параллельных текстов.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №17); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-30 и 1925-06-02, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
FU-Lab. 2023.04.24.-2023.04.28.

опубликовал Öньö Лав в 7:09 28.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.24.-2023.04.28.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводного книжных изданий на коми языке и создание их электронных копий в формате pdf: "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader издания "А.  Мусатов. Гӧра йылын керка" (1950), проверка  орфографии, обработка распознанного текста в программе LibreOffice Writer и его первичное выравнивание в программе WinMerge с  русскоязычным квивалентом для параллельного корпуса.
  4. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "Л. Г. Терехова, В. Г. Эрдели. География : учебние для четвертого класса начальной школы" (1938), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года  для параллельного корпуса.
  5. Завершение работы по переводу на русский язык комиязычных фраз и предложений  учебника "Коми язык. 5 класс" (части 1 и 2) и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  6. Продолжение перевода на русский язык  комиязычных фраз и предложений  учебника "Коми язык. 6 класс" (части 1 и 2, 2018 г.) для включения в базу параллельных текстов на коми и русском языках.
  7. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Раевский Степан Семенович. Заключение лицензионного договора с правообладателем.
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)";
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-21, 1925-05-23, 1925-05-27, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №15); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:56 24.04.2023

27.03.2023–24.04.2023.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
  3. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1954), "С. Григорьев. Малахов курган" (1952).
  4. Выравнивание в программе WinMerge коми текстов "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951), с русскими эквивалентами и их включение в базу параллельных текстов на коми и русском языках.
  5. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года.
  6. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках, обработка текстов (разбивка по предложениям, сортировка, устранение повторов) и начало перевода отдельных предложений на русский язык.
  7. Завершение работы по переводу на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  8. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" и "Коми язык. 6 класс" (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  9. Продолжение работы с  текстами новостного массива радио "Коми гор": вычленение русскоязычного новостного массива  за 2018 г.  корректирование русского текста за 2017 год, обработка файла с коми текстом за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы.
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №12-15) и журнала "Йӧлӧга" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14 и 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)".
  13. Восстановление коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 2023.04.17.-2023.04.21.

опубликовал Öньö Лав в 23:39 20.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.17.-2023.04.21.
     

  1.  
  2. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1954), "С. Григорьев. Малахов курган" (1952).
  3. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям произведений С. Бабаевского "Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "Му весьтын свет" (1951).
  4. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года и восполнение лакун по изданию 1936 года.
  5. Продолжение перевода на русский язык коми текста учебников "Коми язык. 5 класс"  и "Коми язык. 6 класс"  для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №15); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.04.10.-2023.04.14.

опубликовал Öньö Лав в 21:14 13.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.10.-2023.04.14.

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955).
  3. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950). 
  4. Выравнивание в программе WinMerge коми текстов, указанных в п. 3, с русскими эквивалентами и их включение в базу параллельных текстов на коми и русском языках.
  5. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках, обработка текстов (разбивка по предложениям, сортировка, устранение повторов) и начало перевода отдельных предложений на русский язык.
  6. Продолжение перевода на русский язык коми текстов из учебников "Коми язык. 5 класс" для включения в базу параллельных текстов на коми и русском языках.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-16 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №14); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)".
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 2023.04.03.–2023.04.07.

опубликовал Öньö Лав в 20:35 06.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.03.–2023.04.07.

  1.  
  2. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  3. Перевод на русский язык коми текстов из учебников "Коми язык. 5 класс" для включения в базу параллельных текстов на коми и русском языках.
  4. Продолжение работы с  текстами новостного массива радио "Коми гор": корректирование русского текста за 2017 год, обработка файла с коми текстом за 2019-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы.
  5. Начало восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование сырой версии переводчика.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №13); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-12 и 1925-05-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  11. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 27.03.2023–31.03.2023.

опубликовал Öньö Лав в 21:30 30.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 27.03.2023–31.03.2023.
 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
  3. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс, часть 1" (2018) для включения в базу параллельных текстов на коми и русском языках.
  4. Завершение работы по переводу на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  5. Вычленение русскоязычного новостного массива радио "Коми гор" за 2018 г. 
  6. Продолжение обработки общего файла с коми текстом новостного массива радио "Коми гор" за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за 2014-2018 гг.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №12) и журнала "Йӧлӧга" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-09 (приложение "Коми сикт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
2023ʼ вося медводдза квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:03 23.03.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940),  "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
2.2. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
2.3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
2.4. Перевод с русского языка на коми язык стабильных текстов официальных сайтов администрации и совета МОГО "Сыктывкар" и     выравнивание коми и русских эквивалентов по предложениям в программе WinMerge.
2.5. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы).    
2.6. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.    
2.7. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
2.8. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.
2.9. Локализация интерфейса desktop приложения менеджера Telegram на коми язык и начало локализации iOs и Android приложений менеджера Telegram.
2.10. Предварительная работа по локализации интерфейса браузера Mozilla FireFox на коми язык.
2.11. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    
2.12. Изучение модели нейросети Sockeye для создания автоматического переводчика.

  • Объем параллельного корпуса на 2023-03-28 составляет 1 215 882 выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:
     
3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954), С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
3.2. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводных изданий: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948),   "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52; 2023. №№-11) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №№1, 2);  обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.4. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в минувшем году в обработанных текстах.

  • Объём корпуса коми языка на 2023-03-28 составляет 77975391 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 30 номеров газеты "Југыԁ туј" (1925-02-14,  1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07), их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

  • Объём молодцовского корпуса на 2023-03-28 составляет 2451193 словоупотреблений.

    
5. Пополнение онлайн библиотеки "Коми гижӧд":
    
5.1. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений авторов Касеева Клавдия Андреевна и Габов Прокопий Валентиновий. Заключение лицензионных договоров с авторами.
5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна.
5.3. Размещение в коми онлайн библиотеке «Коми гижӧд» аудиоматериала к текстам произведений Г. И. Попова.
5.4. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 30 номеров газеты "Југыԁ туј" в переводе на современную графику.
5.5. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000 для коми онлайн библиотеки.

  • Количество текстов в библиотеке возрасло на 746 и на 2023-03-28 составляет 14799 единиц.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание авторской wiki-страницы и библиографии текстов авторов Габов П. В и Касеева К. А., размещение ссылок на произведения, размещенные в библиотеке "Коми гижӧд".
6.2. Пополнение библиографии текстов автора Карманова К. И. на wiki-странице автора, добавление ссылок на новые произведения, размещенные в библиотеке "Коми гижӧд".
6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)", "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)", "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)".
6.4. Создание и заполнение wiki-страниц с оглавлением по 30 номеров газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".
6.5. Создание перечня коми поэм и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
6.6. Пополнение таблицы по комиязычным изданиям книгами за 2022 год.

7. Помощь коллегам в регионах:

7.1. Расппространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате "Языков много — код один".

8. Пополнение лексической базы FU-Lab:
 
8.1. Редактирование и размещение материала коми-русского и русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
9.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.  

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Иное.

12.1. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.  
12.2. Подборка текстов всех коми поэм для анталогии текстов данного жанара по просьбе Союза писателей Республики Коми.

13. Участие в мероприятиях:  
 Участие в мероприятии "Ӧтувъя коми диктант".  

2023ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 21:53 22.03.2023

27.02.2023–24.03.2023.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
  3. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычным эквивалентом: "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)".
  6. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
  7. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы).    
  8. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.    
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №7-11) и журнала "Йӧлӧга" (2023 №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).      
  11. Изучение модели нейросети Sockeye для создания автоматического переводчика.
  12. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    
  13. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.  
  14. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  15. Создание перечня коми баллад и подборка текстов коми поэм для Союза писателей Республики Коми и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
  16. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  17. Распространение комиязычного контента в соц. сетях.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  19. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  20. Участие в мероприятии "Ӧтувъя коми диктант".   
FU-Lab. 2023.03.20 – 2023.03.24

опубликовал Öньö Лав в 21:51 22.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.20 – 2023.03.24.

 

  1.  
  2. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычным эквивалентом:  М. Горький "Америка йылысь" (1954), А. Рыбаков "Кортик" (1954).
  3. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы), выделение коми текста, разбивка на предложения, сортировка, выправление предложений, перевод. 
  4. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №11); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Сбор текстов всех имеющихся коми поэм для Союза писателей Республики Коми.
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.03.13 – 2023.03.17

опубликовал Öньö Лав в 10:57 17.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.13 – 2023.03.17.

  1.  
  2. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954),  А. Рыбаков "Кортик" (1954), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-04-25 (Коми сикт) и 1925-04-28, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №9, №10); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса.
  6. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.
  7. Создание перечня коми поэм для Союза писателей Республики Коми и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
  8. Редактирование интерфейса финансового раздела калькулятора MATE.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 

FU-Lab. 2023.03.06 – 2023.03.10

опубликовал Öньö Лав в 20:09 09.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.06 – 2023.03.10.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
  3. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957).
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)";
  5. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика" (продолжение).
  6. Перевод интерфейса финансового раздела калькулятора MATE.
  7. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-04-21, 1925-04-23, 1925-04-24, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.27 – 2023.03.03

опубликовал Инна в 4:30 03.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.27 – 2023.03.03.
     

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948);
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), Го Можо "Рассказъяс" (1954).
  4. Первичное выравнивание в программе WinMerge коми текста переводного издания с русскоязычным эквивалентом: "Б. Изюмский. Алӧй погонъяс. Зрелость"_1956.
  5. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  6. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №7-8) и журнала "Йӧлӧга" (2023 №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.
  8. Изучение модели нейросети Sockeye для создания автоматического переводчика.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Расппространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  14.  Участие в мероприятии "Ӧтувъя коми диктант".
FU-Lab. 2023.02.20 – 2023.02.22

опубликовал Öньö Лав в 11:47 22.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.20 – 2023.02.22.

  1.  
  2. Продолжение выравнивания в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Б. Изюмский. Алӧй погонъяс"_1955.
  3. Распознавание и вычитка в программе ABBYY FineReader текста переводного издания: "Б. Изюмский. Алӧй погонъяс. Зрелость"_1956.
  4. Редактирование и размещение материала коми-русского словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  5. Презентация ресурса "Коми мутӧдӧм" участникам мероприятия "Географический диктант Республики Коми". (18.02.2023)
  6. Подготовка презентации и выступление по теме "Деятельность FU-Lab в 2021-2022 гг." в рамках ежегодного отчета-презентации деятельности ЦИЯТ. (21.02.2023)
  7. Запись интервью для телевизионной программы "Вочакыв" КРТК "Юрган". (21.02.2023)
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ урасьӧмся отчётӧ FU-Lab-лӧн пай

опубликовал Инна в 1:03 21.02.2023

2023.01.25 - 2023.02.22

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводных изданий: "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959).
  4. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке: "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)".
  6. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959).
  7. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000.
  8. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.
  9. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
  10. Перевод названий разделов сайта администрации МР "Прилузский" на коми язык.
  11. Перевод с русского языка на коми язык стабильных текстов официального сайта Совета Сыктывкара для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  12. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна. Пополнение библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  13. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов статей П. В. Габова. Создание авторской страницы и библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  14. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №3-6) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  15. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  16. Локализация интерфейса desktop приложения менеджера Telegram на коми язык. и начало локализации iOs и Android приложений менеджера Telegram.
  17. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
  18. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  19. Продолжение работы по локализации интерфейса браузера Mozilla FireFox на коми язык.
  20. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  21. Распространение комиязычного контента в соц. сетях.
  22. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.13 – 2023.02.17

опубликовал Öньö Лав в 21:20 16.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.13 – 2023.02.17.

  1.  
  2. Сканирование в программе ABBYY FineReader переводного книжного издания на коми языке и создание его электронной копии в формате pdf: Го Можо "Рассказъяс" (1954).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950).
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955).
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)";
  6. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №6) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Перевод названий разделов сайта администрации МР "Прилузский" на коми язык.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-31, 1925-04-02 и 1925-04-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Продолжение локализации на коми язык интерфейса desctop приложения и начало локализации iOs и Android приложений менеджера Telegram.
  10. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.06 – 2023.02.10

опубликовал Инна в 0:48 10.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.06 – 2023.02.10.

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959).
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Л. Н. Толстой. Казакъяс" (1956), "Е. Пермяк. Вӧсни струна" (1959), А. Сент-Экзюпери "Ичӧтик принц" (2022).
  5. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.
  6.  Выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке:  "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)".
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-21 и 1925-03-27, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Локализация интерфейса desktop приложения менеджера Telegram на коми язык.
  12. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.01.30 – 2023.02.03

опубликовал Öньö Лав в 18:36 02.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.01.30 – 2023.02.03.

 

  1. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: А. Сент-Экзюпери "Ичӧтик принц" (2021), Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956).
  2. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021).
  3. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), а также коми перевода стабильных текстов официального сайта администрации Совета Сыктывкара с русскоязычным оригиналом.
  4. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000.
  5. Сборка текстов новостной ленты официального портала РК за сентябрь 2022 г. - январь 2023 г.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке: "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" 
  9. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов статей П. В. Габова. Создание авторской страницы и библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-12, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
  12. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика