FU-Lab. 2025.01.09.-2025.01.10

опубликовал Öньö Лав в 23:15 10.01.2025

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2025.01.09.-2025.01.10

  1. Создание фотокопий номеров газеты "Коми му" за первое полугодие 1991 года.
  2. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №52); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текстов газет «Коми му» (1991. № 5) и «Югыд туй» (1990. № 145).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице: "В. Н. Львов. Мый му пытшкын?" (1935), "В. Н. Львов. Музэгалӧммез" (1935), "В. Н. Львов. Вулканнэз" (1936), "В. А. Тетюрев. Природатӧдӧм. 1 тор. Куимӧт велӧтчан во" (1934), "В. А. Тетюрев. Природатӧдӧм. Мӧдік тор. Нёльӧт велӧтчан во" (1933), "И. Борисов, Е. Марова. Л. Павличева, В. Тетюрев. Природатӧдӧм. Етша велӧтчӧм йӧзлӧ" (1933), "П. Веприков, В. Ившин. Быдмас. Кыдз сія олӧ, кыдз керӧм да кытшӧм сетӧ польза" (1934), "В. Г. Фридман. Мый вылын видзсьӧ му" (1934).
  5. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  6. Вычитка варианта на современной орфографии и корректирование в программе LibreOffice Writer удмуртского текста учебника "Н. Н. Баранский. СССР географи. Шор ёзо школаын 6 но 7 араз дышетон книга. Нырысетӥ люкетэз" (1933).
  7. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  8. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2024.12.23.-2024.12.28

опубликовал Öньö Лав в 18:10 26.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.23.-2024.12.28

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Создание фотокопий газет «Югыд туй» (1990. №№ 1-78) и «Коми му» (1991. №№1-9).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка распознанного текста газет «Югыд туй» (1990. №№ 1, 2, 153, 154, 155, 156) и «Коми му» (1990. № 1-4) в программе LibreOffice Writer.
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Чужан муыд быдӧнлы колӧ (Э. Поляковалӧн 2024ʼ вося небӧг)", "Кӧдзыд пӧль (А. Сукгоевалӧн 2024ʼ вося небӧг)", "Ылӧ кольӧм вояс (Е. А. Игушевлӧн 2024ʼ вося небӧг)".
  5. Внесение правок в текст "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".
  6. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ вося отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:59 18.12.2024

2023-12-25–2004-12-20.

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий 44 русскоязычных издания, с которых были сделаны коми переводы: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957), "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937), "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).

2.2. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов 42 комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Валентин Катаев. Полклӧн пи" (1947), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Сталин йылысь висьтъяс" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), а также 12 pdf-копий русскоязычных оригиналов коми изданий:  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "Ф. Гладков. Клятва" (1947).

2.3. Распознавание и вычитка в программе ABBYY Fine Reader текстов 55 русскоязычных изданий, имеющих коми эквиваленты: "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947), "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951), "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936);  обработка данных текстов в программе LibreOffice Writer.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов 106 переводного издания: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Валентин Катаев. Полклӧн пи" (1947), "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955), "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937), "Иосиф Виссарионович Сталин: краткӧй биография" (1947), M. J. Cuzmer. Zoologija" (1933), "М. Ј. Цузмер. Зоологіја" (1936), B. V. Vşeşvjatskij. Вotaꞑika (1934), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936).

2.5. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.6. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.8. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь-декабрь 2023 г. и январь-июль 2024 г., их выравнивание по предложениям в программе WinMerge и включение в параллельный корпус.

2.9. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 23-25.01 и 2-3.07.2024 c сайта bnkomi.ru,  за 11-15.01 и 2-3.07.2024 c сайта komiinform.ru; редактирование коми текстов и выравнивание коми и русских текстов в программе WinMerge для включения в  базу переводчика.

2.12. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) и текста издания: "А. Шебырев. Фараон" (2019) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.

2.13. Подбор и распределение материала для перевода на коми язык из массива корпуса текстов, предоставленных МКАO «Яндекс»; восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс"; сборка текстов переводов, сделанных для МКАО "Яндекс".

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках; терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

2.18. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.19. Исправление метаразметки в параллельном корпусе.

2.20. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

2.21. Сбор оригинальных и переводных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок для корпуса коми языка. Выравнивание нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса.

Объём русско-коми параллельного корпуса за отчетный период возрос на 329 177 единиц и к 2024-12-20 составляет 1 742 005 выравненных предложений (с повторами).

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий 94 комиязычный изданий: "О. Шлопова. Туръяса мойдъяс да висьтъяс", "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Шӧр нэмъяслӧн история" (1941), "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов 124 изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история" (1941), "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "А. Мишарин. Кор лэбзьӧ коляоз" (2016) ; обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-декабрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№79-152 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-51), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1-11), "Войвыв кодзув" (2023 №№11-12; 2024 №1-11), "Чушканзі" (2021. №1; 2022. №№1-12; 2023 №№ 1-12, 2024. №№ 1-11) и "Би кинь" (2020. №№11, 12; 2024. №№1-11), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №№ 1-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Продолжение технической работы над историческим разделом корпуса коми языка.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 5 369 844 единицы и к 2024-12-20 составляет 87 114 057 словоупотреблений.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 9 комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937), "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936)

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1925. №№ 25-37; 1926 №№ 1-16), газеты "Југыԁ туј" (1925. №№ 210, 213, 215, 219, 226, 228, 232, 237, 241, 246, 251; 1926. №№ 19, 20) и журнала "Комі му" (1924. №№ 3, 4-6, 7-10; 1925 №№ 3-4, 5, 6-7, 8, 9, 10-11, 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".

4.4. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий:  "M. J. Cuzmer. Zoologija" (1933), "B. V. Vşeşvjatskij. Вotaꞑika" (1934).

4.5. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 351 495 единиц и к 2024-12-20 составляет 2 985 629 словоупотреблений.

Объём латинского корпуса за отчетный период возрос на 57 795 единиц и к 2024-12-20 составляет 420 148 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 25 номеров газеты "Комі ԍікт" и 15 номеров газеты "Југыԁ туј" за 1925-1926 гг., а также коми текстов 10 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

5.2. Размещение в онлайн библиотке "Коми гижӧд" 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015).

5.3. Размещение в онлайн библиотеке "Коми гижӧд" 51 произведения из журналов:  Алёна Ельцова: стихотворения "Каня-понъя", "Пӧжасьысьяс", "Кӧза", "Пон да кань"; "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз";  Алёна Старцева: "Ӧтик-мӧтик", "Аддзӧмтор"; Алёна Шомысова: "Каньлы ним",  "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз"; Баженова Ольга: стихотворение "Чушканзі";  Василий Лодыгин: стихотворения "Медсяяс", "Муса чужанін";  Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Елена Афанасьева: "Вӧрса гусяторъяс"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", "Мичаа шырӧм", "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс"; рассказ "Тыдавтӧм кымӧр";  Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; "Мык",  "Транспортир",  "Патер", "Сконйыштчис"; Нина Обрезкова: "Пӧчлы отсӧг"; Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун";  Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь".

Количество текстов в библиотеке за отчетный период возрасло на 1645 единиц и к 2024-12-20 составляет 18429 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.

6.2. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по 126 книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939), "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", "Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг)", "Ботаника (1952ʼ вося небӧг)", "Гажа мойдъяс (1948ʼ вося небӧг)", "География (4-ӧд класслы 1956ʼ вося небӧг)"‎‎, "География кузя лыддьысян книга (1957ʼ вося небӧг)", "Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг)", "Зоология (1952ʼ вося небӧг)"‎‎, "Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг)", "Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг)", "Руч да кӧч (1959ʼ вося небӧг)", "Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг)", "СССР-лӧн география (1957ʼ вося небӧг)", "СССР-лӧн история (1963ʼ вося небӧг)"‎‎, "Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг)", "Тема да Жучка (1954ʼ вося небӧг)", "Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг)", "Январь 9-ӧд лун (М. Горький, 1958ʼ вося небӧг)", "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎", "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)", "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".

6.3. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-12, 2024. №№ 1-11).

6.4. Пополнение   указателей авторов и произведений журнала "Би кинь" материалом №№ 1-10 за 2024 г.

6.5. Создание и заполнение wiki-страниц с оглавлением по 34 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925-1926 гг. в онлайн-справочнике "Коми тӧданін".

6.6. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.7. Пополнение страниц авторов и переводчиков ссылками на издания, добавленные за истекший период.

7. Пополнение лексической базы FU-Lab:

7.1. Лингвистическая разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab" и редактирование его текста.

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

8.2. Разбивка и первичное выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953) как образец данного вида работы для сектора языка УИИЯЛ УдмФИЦ УрО РАН.

8.3. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.

8.4. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

9.2. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

9.3. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии и выравнивание по предложениям в программе WinMerge русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934)  с коми, коми-пермяцким и удмуртским переводами.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

10.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

10.3. Разработка сайта "Пермистика" (http://permistica.komikyv.com/) с функцией поиска по различным критериям и возможностью добавления pdf статей.

10.4. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.

10.5. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей, их обработка и загрузка на сайт "Пермистика".

10.6. Создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.

10.7. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

12.2. Распространение комиязычного контента в соц. сетях.

12.3. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12.4. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

12.5. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

13. Участие в мероприятиях и выступления в сми:

13.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

13.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

13.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

13.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

13.5. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

13.6. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

13.7. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

13.8. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

13.9. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.

13.10. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024).

13.11. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.

13.12. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик". (Москва, 12.12.2024).

2024ʼ вося нёльӧд кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:42 18.12.2024

2024-09-23 – 2024-12-20

 

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.

2.2. Сбор оригинальных и переводных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок для корпуса коми языка. Выравнивание нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса.

2.3. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 2024.07.02 и 2024.07.03, редактирование коми текстов для включения в базу переводчика.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текста комиязычного издания "Иосиф Виссарионович Сталин: краткӧй биография" (1947).

2.5. Приобретение, сканирование, обработка и распознавание в программе ABBYY FineReader, создание pdf копий, обработка в программе LibreOffice Writer текстов русскоязычных учебников, имеющих коми переводы: "Б. В. Всесвятский. Ботаника" (1934), "Б. В. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).

2.6. Разбивка на строки текстов учебников "M. J. Cuzmer. Zoologija" (1933) / "М. Я. Цузмер. Зоология" (1933) и B. V. Vşeşvjatskij. Вotaꞑika (1934) / "Б. В. Всесвятский. Ботаника" (1934),  на коми (в совр. орфографии) и русском языках и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

2.7. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer переводных текстов учебников на молодцовице "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936); конвертация текстов на современную графику, повторная вычитка и корректирование по современной орфографии в программе LibreOffice Writer, разбивка на предложения и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  текста комиязычных изданий "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951).

3.3. Извлечение из pdf файла текстов, проверка орфографии, обработка в программе LibreOffice Writer комиязычного текста издания "А. Мишарин. Кор лэбзьӧ коляоз" (2016).

3.4. Создание фотокопий статей номеров газеты "Югыд туй" за октябрь-декабрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" (1990. №№111-152) и их обработка в программе LibreOffice Writer. Редактирование текстов газеты (1990. №№ 105-151) для включения в корпус коми языка.

3.5. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №39-51);  журналов "Йӧлӧга" (2024. №№ 7-11), "Войвыв кодзув" (2024. №№ 5-11), "Чушканзі" (2021. №1; 2022. №№1-12; 2023 №№ 1-12, 2024. №№ 1-11) и "Би кинь" (2020. №№11, 12; 2024. №№1-11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Продолжение технической работы над историческим разделом корпуса коми языка.

3.7. Добавление в корпус коми языка текстов, обработанных за отчетный период.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 13-16), их обработка в программе LibreOffice Writer и включение в молодцовский корпус;

4.2. В молодцовский корпус добавлены также тексты изданий  "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936).

4.3. В латинский корпус добавлены тексты изданий "M. J. Cuzmer. Zoologija" (1933), "B. V. Vşeşvjatskij. Вotaꞑika" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотке "Коми гижӧд" 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015).

5.2. Размещение в онлайн библиотеке "Коми гижӧд" 51 произведения из журналов:  Алёна Ельцова: стихотворения "Каня-понъя", "Пӧжасьысьяс", "Кӧза", "Пон да кань"; "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз";  Алёна Старцева: "Ӧтик-мӧтик", "Аддзӧмтор"; Алёна Шомысова: "Каньлы ним",  "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз"; Баженова Ольга: стихотворение "Чушканзі";  Василий Лодыгин: стихотворения "Медсяяс", "Муса чужанін";  Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Елена Афанасьева: "Вӧрса гусяторъяс"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", "Мичаа шырӧм", "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс"; рассказ "Тыдавтӧм кымӧр";  Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; "Мык",  "Транспортир",  "Патер", "Сконйыштчис"; Нина Обрезкова: "Пӧчлы отсӧг"; Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун";  Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь".

5.3. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 4 номеров газеты "Комі ԍікт"  за 1925 г. в переводе на современную графику.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.

6.2. Создание указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024 №№7-11).

6.3. Пополнение   указателей авторов и произведений журнала "Би кинь" материалом №№ 1-10 за 2024 г.

6.4. Создание и заполнение wiki-страниц с оглавлением по отдельным номерам газеты "Комі ԍікт" (1926 №№ 13-16).

6.5. Создание и заполнение отдельных страниц по книжным изданиям на коми языке: "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".

6.6. Внесение правок на страницы авторов: "Старцева Алёна Николаевна", "Шомысова Алёна Александровна", "Обрезкова Нина Александровна",  "Афанасьева Елена Евгеньевна", "Вурдов Алексей Иванович", "Попов Геннадий Иванович", "Габов Прокопий Валентинович", "Баженова Ольга Николаевна", "Ельцова Алёна", "Зарни Люся", "Ногиев Иван Иванович", "Попов Серафим Алексеевич", "Игушев Евгений Александрович" справочного wiki-ресурса "Коми тӧданін" с созданием ссылок на произведения, размещенные в коми онлай библиотеке "Коми гижӧд".

7. Пополнение лексической базы FU-Lab:

7.1. Внесение исправлений в онлайн-словарь "Перем коми кывкуд" на сайте dict.komikyv.org.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

9. Развитие мультиязычного корпуса по пермским языкам:

9.1. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии и выравнивание по предложениям в программе WinMerge русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934)  с коми, коми-пермяцким и удмуртским переводами.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Разработка сайта "Пермистика" (http://permistica.komikyv.com/) с функцией поиска по различным критериям и возможностью добавления pdf статей.

10.2. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.

10.3. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей, их обработка и загрузка на сайт "Пермистика".

10.4. Создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Распространение комиязычного контента в соц. сетях.

12.2. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Участие в мероприятиях и выступления в сми:

13.1. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024).

13.2. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.

13.3. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик". (Москва, 12.12.2024).

2024ʼ ӧшым тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:58 18.12.2024

2024-11-25–2024-12-20.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Разбивка текстов учебника "M. J. Cuzmer. Zoologija" (1933) / "М. Я. Цузмер. Зоология" (1933) на коми (в совр. орфографии) и русском языках на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  4. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer переводных текстов учебников на молодцовице "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936); конвертация текстов на современную графику, повторная вычитка и корректирование по современной орфографии в программе LibreOffice Writer, разбивка на предложения и выравнивание с русскими оригиналами в программе WineMerge. Добавление текстов на молодцовице в молодцовский корпус, а выравненных текстов в параллельный русско-коми корпус.
  5. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 141-152), обработка их в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов). Редактирование текстов №№137-151 и включение их в корпус коми языка.
  6. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №48-51), номеров журналов "Войвыв кодзув" (2024. № 11), "Йӧлӧга" (2024. № 11),  "Чушканзі" (2021. №1; 2022. №№1-12; 2023. №№1-9; 2024 № 11) ) и "Би кинь" (2020. №№11, 12; 2024. № 11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 16), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Завершение создания общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год  на справочном wiki-ресурсе "Коми тӧданін".
  9. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 11).
  10. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун"; Баженова Ольга: стихотворение "Чушканзі"; Алёна Ельцова: стихотворения "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз"; Зарни Люся: рассказ "Тыдавтӧм кымӧр";  Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; В. Лодыгин: стихотворения "Медсяяс", "Муса чужанін"; Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи"; Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь"; Алёна Ельцова; стихотворения "Пӧжасьысьяс", "Кӧза", "Пон да кань";
  11. Внесение правок на страницы "Габов Прокопий Валентинович", "Баженова Ольга Николаевна", "Ельцова Алёна", "Зарни Люся", "Ногиев Иван Иванович", "Попов Серафим Алексеевич", "Игушев Евгений Александрович" справочного wiki-ресурса "Коми тӧданін" с созданием ссылок на произведение, размещенные в коми онлай библиотеке "Коми гижӧд".
  12. Внесение исправлений в онлайн-словарь "Перем коми кывкуд" на сайте dict.komikyv.org.
  13. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования».
  14. Продолжение технической работы над историческим разделом корпуса коми языка.
  15. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  18. Проведение презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024)
  19. Участие в работе ежегодной конференции "Языковая политика в Российской Федерации", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.
  20. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис "Яндекс-переводчик".
FU-Lab. 2024.12.16.-2024.12.20

опубликовал Öньö Лав в 11:23 18.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.16.-2024.12.20

  1.  
  2. Вычитка в программе LibreOffice Writer конвертированных на современную графику текстов учебников "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936). Выравнивание текстов по предложениям с русскими оригиналами в программе WineMerge. Добавление текстов на молодцовице в Молодцовский корпус, а выравненных текстов в русско-коми корпус.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов газеты «Югыд туй» (1990. №№ 145, 150, 151, 152), обработка их в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  4. Редактирование текстов газеты «Югыд туй» №№ 145-151 за  1990 год.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му"  (2024. №51) и номеров журнала "Чушканзі" (2021. №1, 2022. № 1-3); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. № 16), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Серафим Попов: стихотворения "Еджыд ывла", "Ичӧт лыддьысьысь"; Зарни Люся: стихотворения "Аканьяс", "Батьӧ ньӧбис телевизор"; Алёна Ельцова; стихотворения "Пӧжасьысьяс", "Кӧза", "Пон да кань";
  8. Внесение правок в страницы "Зарни Люся", "Попов Серафим Алексеевич", "Ельцова Алёна" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на произведения.
  9. Продолжение технической работы над историческим разделом корпуса коми языка.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.12.09.-2024.12.13

опубликовал Öньö Лав в 0:03 13.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.09.-2024.12.13

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader текстов газеты «Югыд туй» (1990. № 146, 147, 148, 149), обработка их в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  3. Редактирование текстов газеты «Югыд туй» № 139, № 140, № 141, № 142, № 143, №144 за  1990 год.
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му"  (2024. №50) и номеров журнала "Чушканзі" (2022 № 4-6); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики,  метаразметка и расстановка языковых тэгов).
  5. Распространение комиязычного контента в соц. сетях.
  6. Участие в работе конференции "Языковая политика-2024", организованной Федеральным агентством по делам национальностей Российской Федерации (Москва, 10-11 декабря 2024 года), выступление на панельной сессии "Механизмы поддержки и развития языков народов Российской Федерации в цифровом пространстве" с презентацией сервиса сортировки списков на языках народов РФ.
  7. Переговоры с представителями МКАО "Яндекс" о передаче дополнительного коми материала для работы по включению коми языка в онлайн сервис Яндекс-переводчик.
FU-Lab. 2024.12.02.-2024.12.06

опубликовал Öньö Лав в 18:52 05.12.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.12.02.-2024.12.06

  1.  
  2. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №49), номеров журналов "Войвыв кодзув" (2024. № 11), "Йӧлӧга" (2024. № 11), "Чушканзі" (2022. №№ 7-8; 2024 № 11) и "Би кинь" (2020. №№11, 12; 2024. № 11); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer переводных текстов учебников на молодцовице "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "М. Ј. Цузмер. Зоологіја" (1936).
  4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов газеты «Югыд туй» (1990. № 148).
  5. Редактирование текстов газеты «Югыд туй» (1990. №№137, 138).
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Прокопий Габов: статья "Андаман саридзса Пхукетын дас лун"; Баженова Ольга: стихотворение "Чушканзі"; Алёна Ельцова: стихотворения "Поэзия", "Кымӧр-кунӧр", "Китыр лым чирйӧн али кодзулӧн...", "Вой кежлас ывлаын ёна на кынтавлӧ...", "Рӧмдас да, керкаысь ывлаӧ пета...", "Югыдлӧз", "Турунъяс вӧрзьӧны пемыд му пыдӧсын...", "Йӧлӧга шыӧн таланьӧ коркӧ волы...", "Эз жарӧн, Эз косӧн...", "Вылісянь сьылӧмӧн му вылӧ...", "Сьыв мен асъядорыс, шоныд тӧвру...", "Усь, лымйӧй, усь, — мед менам сьӧлӧм югзяс...", "Саридз"; Зарни Люся: рассказ "Тыдавтӧм кымӧр"; В. Лодыгин: стихотворения "Медсяяс", "Муса чужанін".
  7. Внесение правок в страницы "Габов Прокопий Валентинович", "Баженова Ольга Николаевна", "Ельцова Алёна", "Зарни Люся" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на произведения.
  8. Завершение создания общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год  на справочном wiki-ресурсе "Коми тӧданін".
  9. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 11).
  10. Продолжение технической работы над историческим разделом корпуса коми языка.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Участие в презентации корпуса коми-пермяцкого языка в рамках конференции «Развитие коми-пермяцкой письменности и коми-пермяцкого языка» (Кудымкар, 06.12.2024)
FU-Lab. 2024.11.25.-2024.11.29

опубликовал Öньö Лав в 11:17 29.11.2024

​В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.11.25.-2024.11.29

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 141-143).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №48) и журнала "Чушканзі" (2023 №№ 1-9, 2022 №№ 9-12)); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Разбивка текстов учебника "M. J. Cuzmer. Zoologija" (1933) / "М. Я. Цузмер. Зоология" (1933) на коми и русском языках на строки и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Иван Ногиев: рассказы "Гӧрд пӧк", "Крукасин"; Евгений Игушев: рассказ "Сюрук Ӧксялӧн ыжпи".
  7. Внесение правок в страницу "Ногиев Иван Иванович", "Игушев Евгений Александрович" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылки на произведение в ресурсе http://komikyv.org/kpv.
  8. Внесение исправлений в онлайн-словарь "Перем коми кывкуд" на сайте dict.komikyv.org.
  9. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования».
  10. Продолжение создания общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.
  11. Продолжение технической работы над историческим разделом корпуса коми языка.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ вӧльгым тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:31 21.11.2024

2024-10-21–2024-11-22.
 

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Завершение выравнивания нормативно-правовых актов РК на коми и русском языках за 2023 год для параллельного корпуса коми языка.
  4. Завершение перевода с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 2024.07.02 и редактирование коми текстов для включения в базу переводчика.
  5. Завершение распознавания и вычитки в программе ABBYY FineReader текста комиязычного издания "В. Юхнин. Тундраса бияс. Первой часть" (1949), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  6. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текста издания "В. Юхнин. Тундраса бияс. Мӧд часть" (1951).
  7. Извлечение из pdf файла текстов, проверка орфографии, обработка в программе LibreOffice Writer комиязычного текста издания "А. Мишарин. Кор лэбзьӧ коляоз" (2016).
  8. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текста комиязычного издания "Иосиф Виссарионович Сталин: краткӧй биография" (1947).
  9. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов газеты "Югыд туй" за 1990 г. (№№ 126-140), редактирование текстов №№ 105-136 для корпуса коми языка.
  10. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №43-47), журналов "Йӧлӧга" (2024. №№ 7-10), "Войвыв кодзув" (2024. №№ 5-10), "Чушканзі" (2023 №№ 10-12, 2024. №№ 1-10) и "Би кинь" (2024. №№1-10); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 13-15), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Размещение в онлайн библиотеке "Коми гижӧд" ряда произведений из журналов:  "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", "Мичаа шырӧм", "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс" (Людмилы Втюрина), "Мык",  "Транспортир",  "Патер", "Сконйыштчис" (Иван Ногиев), "Ӧтик-мӧтик", "Аддзӧмтор" (Алёна Старцева),  "Каня-понъя" (Алёна Ельцова), "Каньлы ним",  "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз" (Алёна Шомысова), "Пӧчлы отсӧг" (Н. Обрезкова), "Вӧрса гусяторъяс" (Е. Афанасьева).
  13. Внесение правок в страницы "Зарни Люся", "Ногиев Иван Иванович", "Старцева Алёна Николаевна", "Ельцова Алёна", "Шомысова Алёна Александровна", "Обрезкова Нина Александровна", "Ногиев Иван Иванович", "Афанасьева Елена Евгеньевна", "Вурдов Алексей Иванович", "Попов Геннадий Иванович" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на произведения с  wiki-ресурса "Коми тӧданін".
  14. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".
  15. Пополнение на справочном wiki-ресурсе "Коми тӧданін" указателей авторов и произведений журнала "Би кинь" материалом №№ 1-10 за 2024 г.
  16. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024 №№7-10).
  17. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.
  18. Продолжение технической работы над историческим разделом корпуса коми языка.
  19. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.
  20. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  21. Распространение комиязычного контента в соц. сетях.
  22. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.11.18.-2024.11.22

опубликовал Öньö Лав в 14:50 21.11.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.11.18.-2024.11.22

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 138-140).
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №47)и журнала "Чушканзі" (2024. №№ 1-7, 2023 №№ 10-12); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Размещение произведений в онлайн-библиотеке "Коми гижӧд": Иван Ногиев: рассказ "Патер".
  6. Внесение правок в страницу "Ногиев Иван Иванович" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылки на произведение в ресурсе http://komikyv.org/kpv.
  7. Создание общего указателя публикаций журнала «Войвыв кодзув» за 2014-2024 год.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 15), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.
  10. Продолжение технической работы над историческим разделом корпуса коми языка.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.11.11.-2024.11.15

опубликовал Öньö Лав в 21:21 14.11.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.11.11.-2024.11.15

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 135-137), и редактирование №№ 134-136  для корпуса коми языка.
  4. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №46), журнала "Войвыв кодзув" (2024. № 5, 6, 10) и  "Би кинь" (2024. №№1-5); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Извлечение из pdf файла текстов, проверка орфографии, обработка распознанного комиязычного текста издания "А. Мишарин. Кор лэбзьӧ коляоз" (2016) в программе LibreOffice Writer.
  6.  Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текста комиязычного издания "Иосиф Виссарионович Сталин: краткӧй биография" (1947).
  7. Размещение произведений в онлайн-библиотеке "Коми гижӧд": А. Шомысова: рассказы "Льӧм дзоридзалігӧн", "Мӧвп", "Жытник", "Волсяса вичко", "Пес чипас", переводные сказки "Миша ошпи да Би кинь", "Дивӧ-дзоридз", стихотворения Л. Втюриной "Нӧдкывъяс", "Пудъясянкывъяс", "Кывбертласъяс", рассказ И. Ногиева "Транспортир".
  8. Внесение правок в страницы "Шомысова Алёна Александровна", "Зарни Люся", "Ногиев Иван Иванович" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на рассказы и переводные сказки в онлайн-библиотеке.
  9. Заполнение на справочном wiki-ресурсе "Коми тӧданін" таблицы указателей на писателей и произведения в номерах журнала "Би кинь" (2024 №№ 1-10).
  10. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельному номеру журнала "Войвыв кодзув" (2024 № 10).
  11. Пополнение коми-пермяцкого корпуса текстами, предоставленными ГБОУ ДПО «Коми-Пермяцкий институт повышения квалификации работников образования», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.11.05.-2024.11.08

опубликовал Öньö Лав в 20:38 07.11.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.11.05.-2024.11.08

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 132-134), и редактирование №№ 128-133  для корпуса коми языка.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №45), журналов "Войвыв кодзув" (2024. № 7-9), "Чушканзі" (2024. № 10) и "Би кинь" (2024. № 6,7); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Размещение произведений в онлайн-библиотеке "Коми гижӧд": стихотворение Н. Обрезковой "Пӧчлы отсӧг", рассказ И. Ногиева "Сконйыштчис", рассказ Е. Афанасьевой "Вӧрса гусяторъяс".
  6. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024 №№ 7-9).
  7. Внесение правок в страницы "Обрезкова Нина Александровна", "Ногиев Иван Иванович", "Афанасьева Елена Евгеньевна", "Вурдов Алексей Иванович", "Попов Геннадий Иванович" на справочном wiki-ресурсе "Коми тӧданін" с созданием ссылок на произведения с  wiki-ресурса "Коми тӧданін".
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданию на коми языке: "Евлог да сылӧн ёртъяс (И. Ногиевлӧн 2018ʼ вося небӧг)", "Коми попугайяс (В. Бабинлӧн 2018ʼ вося небӧг)", "Шонді дзирд (Э. Тимушевлӧн 2018ʼ вося небӧг)".
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.10.28.-2024.11.02

опубликовал Öньö Лав в 11:27 02.11.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.10.28.-2024.11.02.
 

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текстов текстов газеты "Югыд туй" за 1990 г. (№№ 128-131), и редактирование №№ 126,127 для корпуса коми языка.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №44), журналов  "Йӧлӧга" (2024. №№ 7–10), "Би кинь" (2024. №№ 8–10) и "Чушканзі" (2024. №№ 8,9); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader, обработка  в программе LibreOffice Writer текста издания "В. Юхнин. Тундраса бияс. Мӧд часть" (1951).
  6. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 2024.07.02 и редактирование коми текстов для включения в базу переводчика.
  7. Размещение в онлайн библиотеке "Коми гижӧд" ряда произведений из журналов: стихотворение "Сашук", "Ва пельса", "Гӧстя", "Менам ёрт", рассказ «Мичаа шырӧм» Людмилы Втюриной, рассказ Ивана Ногиева "Мык", стихотворение Алёны Старцевой "Ӧтик-мӧтик", "Аддзӧмтор", стихотворение Алёны Ельцовой "Каня-понъя", стихотворение Алёны Шомысовой "Каньлы ним".
  8. Внесение правок в страницы "Зарни Люся", "Ногиев Иван Иванович", "Старцева Алёна Николаевна", "Ельцова Алёна" и "Шомысова Алёна Александровна" на справочном wiki-ресурсе "Коми тӧданін"  с созданием ссылок на произведения в ресурсе http://komikyv.org/kpv.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.10.21.-2024.10.25

опубликовал Öньö Лав в 23:26 24.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.10.21.-2024.10.25.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  3. Завершение выравнивания нормативно-правовых актов РК на коми и русском языках за 2023 год для параллельного корпуса коми языка.
  4. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru и редактирование коми текстов для включения в базу переводчика .
  5. Завершение распознавания и вычитки в программе ABBYY FineReader текста комиязычного издания "В. Юхнин. Тундраса бияс. Первой часть" (1949), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  6. Начало распознавания и вычитки в программе ABBYY FineReader текста комиязычного издания "В. Юхнин. Тундраса бияс. Мӧд часть" (1951).
  7. Редактирование текстов газеты "Югыд туй" №№ 105-125 за 1990 год.
  8. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" №№ 126-128 за 1990 г.
  9. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №43); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 13-14), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ йирым тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 22:22 23.10.2024

2024-09-24–2024-10-23.

  1. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  2. Сбор оригинальных и переводных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок для корпуса коми языка. Выравнивание нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса.
  3. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 3.07.2024 и редактирование коми текстов для включения в базу переводчика. 
  4. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).
  5. Размещение 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015) в онлайн библиотке "Коми гижӧд".
  6. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  текста комиязычного издания "В. Юхнин. Тундраса бияс. Первой часть" (1949).       
  7. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2024. №39-42); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Создание фотокопий статей номеров газеты "Югыд туй" за октябрь-ноябрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№111-121 и их обработка в программе LibreOffice Writer.
  9. Приобретение, сканирование, обработка и распознавание в программе ABBYY FineReader, создание pdf копий, обработка в программе LibreOffice Writer текстов русскоязычных учебников, имеющих коми переводы: "Б. Всесвятский. Ботаника" (1934), "Б. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).
  10. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии.
  11. Выравнивание по предложениям в программе WinMerge русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934)  с коми, коми-пермяцким и удмуртским переводами.
  12. Разработка сайта "Пермистика" с функцией поиска по различным критериям и возможностью добавления pdf статей.
  13. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.
  14. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей, их обработка и загрузка на сайт "Пермистика".
  15. Создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.
  16. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  17. Распространение комиязычного контента в соц. сетях.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.10.14.-2024.10.18

опубликовал Öньö Лав в 10:17 18.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.10.14.-2024.10.18.

  1.  
  2. Сбор оригинальных текстов нормативно-правовых актов Республики Коми на русском языке за 2023 год, создание метаразметок и подготовка текстов для параллельного корпуса коми языка.
  3. Начало выравнивания нормативно-правовых актов Республики Коми на коми и русском языках за 2023 год для параллельного корпуса коми языка.
  4. Размещение 71 произведения из сборника "В. Г. Лодыгин. Габовсаяс" (2015) в онлайн библиотке "Коми гижӧд".
  5. Начало распознавания и вычитки в программе ABBYY FineReader текста комиязычного издания "В. Юхнин. Тундраса бияс. Первой часть" (1949).
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №42); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  8. Загрузка pdf-файлов со статьями из сборника "Пермистика" на сервер, создание и отладка поискового сервиса и ссылок с сайта "Пермистика" на отдельные файлы.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.10.07.-2024.10.11

опубликовал Öньö Лав в 11:33 11.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.10.07.-2024.10.11.

  1.  
  2. Завершение распознавания и вычитки в программе ABBYY FineReader, проверка орфографии, обработка в программе LibreOffice Writer русскоязычного текста учебника "М. Я. Цузмер. «Зоология" (1936) в целях его дальнейшего выравнивания с коми переводом для параллельного корпуса коми языка.
  3. Сбор переводных текстов нормативно-правовых актов БОП на коми языке за 2023 год, создание метаразметок и подготовка текстов для корпуса коми языка.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №41); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Создание фотокопий статей номеров газеты "Югыд туй" за октябрь-ноябрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№111-121 и их обработка в программе LibreOffice Writer.
  6. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  7. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей и их обработка для загрузки на сайт "Пермистика".
  8. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.30.-2024.10.04

опубликовал Öньö Лав в 19:27 03.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.30.-2024.10.04.

  1.  
  2. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) русскоязычных текстов изданий "Б. Всесвятский. Ботаника" (1936), "А. Н. Кабанов. Анатомия" (1937).
  3. Распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания "М. Я. Цузмер. Зоология" (1936).
  4. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 3.07.2024 и редактирование коми текстов для включения в базу переводчика.
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №40); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  7. Разработка сайта "Пермистика" с функцией поиска по различным критериям и возможностью добавления pdf статей.
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.23.-2024.09.27

опубликовал Öньö Лав в 11:59 27.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.23.-2024.09.27.

  1.  
  2. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий русскоязычных учебников, имеющих коми переводы: "Б. Всесвятский. Ботаника" (1934), "Б. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).
  4. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов изданий "Б. Всесвятский. Ботаника" (1934), "Б. Всесвятский. Ботаника" (1936), "А. Н. Кабанов. Анатомия" (1937).
  5. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии.
  6. Обработка в программе LibreOffice Writer русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934) и его выравнивание по предложениям в программе WinMerge с коми, коми-пермяцким и удмуртским переводами.
  7. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 3.07.2024 и редактирование коми текстов для включения в базу переводчика.
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №39); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ воысь куим квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 18:33 26.09.2024

2023-12-25–2004-09-20.

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий 41 русскоязычных издания, с которых были сделаны коми переводы: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957), "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937).

2.2. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов 42 комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Валентин Катаев. Полклӧн пи" (1947), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Сталин йылысь висьтъяс" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), а также 12 pdf-копий русскоязычных оригиналов коми изданий:  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "Ф. Гладков. Клятва" (1947).

2.3. Распознавание и вычитка в программе ABBYY Fine Reader текстов 52 русскоязычных изданий, имеющих коми эквиваленты: "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947), "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951), "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956);  обработка данных текстов в программе LibreOffice Writer.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов 101 переводного издания: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Валентин Катаев. Полклӧн пи" (1947), "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955), "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937).

2.5. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.6. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.8. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь-декабрь 2023 г. и январь-июль 2024 г., их выравнивание по предложениям в программе WinMerge и включение в параллельный корпус.

2.9. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 23-25.01 и 2-3.07.2024 c сайта bnkomi.ru,  за 11-15.01 и 3.07.2024 c сайта komiinform.ru; редактирование коми текстов и выравнивание коми и русских текстов в программе WinMerge для включения в  базу переводчика.

2.12. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) и текста издания: "А. Шебырев. Фараон" (2019) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика. 

2.13. Подбор и распределение материала для перевода на коми язык из массива корпуса текстов, предоставленных МКАO «Яндекс»; восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс"; сборка текстов переводов, сделанных для МКАО "Яндекс".

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках; терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

2.18. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.19. Исправление метаразметки в параллельном корпусе.

2.20. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

Объём русско-коми параллельного корпуса за отчетный период возрос на 306 859 единиц и к 2024-09-20 составляет 1 719 687 выравненных предложений (с повторами).

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий 94 комиязычный изданий: "О. Шлопова. Туръяса мойдъяс да висьтъяс", "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Шӧр нэмъяслӧн история" (1941), "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов 121 переводных изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история" (1941), "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-сентябрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№79-110 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-38), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1-6) и "Войвыв кодзув" (2023 №№11-12; 2024 №1-4), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №№ 1-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 3 285 176 единицы и к 2024-00-20 составляет 85 029 389 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 9 комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937), "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1925. №№ 25-37; 1926 №№ 1-12), газеты "Југыԁ туј" (1925. №№ 210, 213, 215, 219, 226, 228, 232, 237, 241, 246, 251; 1926. №№ 19, 20) и журнала "Комі му" (1924. №№ 3, 4-6, 7-10; 1925 №№ 3-4, 5, 6-7, 8, 9, 10-11, 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

4.4. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 91 140 единиц и к 2024-09-20 составляет 2 725 274 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 21 номеров газеты "Комі ԍікт" и 15 номеров газеты "Југыԁ туј" за 1925-1926 гг., а также коми текстов 10 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на  893 единицы и к 2024-06-21 составляет 17 677 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по 123 книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939), "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", "Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг)", "Ботаника (1952ʼ вося небӧг)", "Гажа мойдъяс (1948ʼ вося небӧг)", "География (4-ӧд класслы 1956ʼ вося небӧг)"‎‎, "География кузя лыддьысян книга (1957ʼ вося небӧг)", "Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг)", "Зоология (1952ʼ вося небӧг)"‎‎, "Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг)", "Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг)", "Руч да кӧч (1959ʼ вося небӧг)", "Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг)", "СССР-лӧн география (1957ʼ вося небӧг)", "СССР-лӧн история (1963ʼ вося небӧг)"‎‎, "Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг)", "Тема да Жучка (1954ʼ вося небӧг)", "Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг)", "Январь 9-ӧд лун (М. Горький, 1958ʼ вося небӧг)", "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎", "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-12, 2024. №№ 1-6).

6.3. Создание и заполнение wiki-страниц с оглавлением по 30 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925-1926 гг. в онлайн-справочнике "Коми тӧданін".

6.4. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.5. Пополнение страниц авторов и переводчиков ссылками на издания, добавленные за истекший период.

7. Пополнение лексической базы FU-Lab:

7.1. Лингвистическая разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

8.2. Разбивка и первичное выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953) как образец данного вида работы для сектора языка УИИЯЛ УдмФИЦ УрО РАН.

8.3. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

10.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

10.3. Работа по технической разметке будущего сайта "Пермистика".

10.4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

12.2. Распространение комиязычного контента в соц. сетях.

12.3. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12.4. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

12.5. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

13. Участие в мероприятиях и выступления в сми:

13.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

13.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

13.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

13.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

13.5. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

13.6. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

13.7. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

13.8. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

13.9. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.

2024ʼ воысь коймӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:25 26.09.2024

2024-06-24–2024-09-20.

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копий  русскоязычных изданий: "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937).

2.2. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий: "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), русскоязычных изданий "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933);  обработка данных текстов в программе LibreOffice Writer.

2.3. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937).

2.4. Перевод на коми язык с помощью телеграм-бота новостных текстов за 2-3.07.2024 c сайта bnkomi.ru,  за 3.07.2024 c сайта komiinform.ru  и редактирование коми текстов для включения в базу переводчика.

2.5. Сборка текстов новостной ленты официального портала РК за январь-июль 2024 г. и выравнивание данных текстов на коми и русском языках в программе WinMerge.

2.6. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).

2.7. Восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс".

2.8. Распределение дополнительного материала для перевода текстов, предоставленных компанией "Яндекс".

2.9. Сборка текстов переводов, сделанных для МКАО "Яндекс".

2.10. Работа по унификации лексики и орфографии в текстах для переводчика.

2.11. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

Объём параллельного корпуса коми языка за отчетный период возрос на 55 329 единиц и к 2024-09-20 составляет 1 719 687​ выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№25-38), журналов "Йӧлӧга (2024. №№5, 6) и "Войвыв кодзув" (2024. №№2-4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.4. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№89-110 и их обработка в программе LibreOffice Writer.

Объём корпуса коми языка за отчетный период возрос на 551 793 единицы и к 2024-09-20 составляет 85 029 389 словоупотреблений.

4. Текстовое пополнение молодцовского и латинского корпуса: 

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№9, 10, 11, 12), журнала "Комі му" (1924. №№7-10, 1925 №№10-11, 12),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по номерам газеты в онлайн-справочнике "Коми тӧданін".

4.2. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); обработка распознанных текстов в программе LibreOffice Writer.

4.3. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 4 номеров газеты "Комі ԍікт" за 1926, а также коми текстов 3 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на 210 единиц и к 2024-09-20 составляет 17 677 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін": 

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024. №№ 4-6).

7. Пополнение лексической базы FU-Lab:

7.1. Завершение  вторичной разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab",

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab";

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. По лингвистическому ресурсу "Коми кыв":

8.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

8.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

8.3. Работа по технической разметке будущего сайта "Пермистика".

8.4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

9.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Участие в мероприятиях:

12.1 Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.
 

2024ʼ кӧч тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 12:32 23.09.2024

2024-08-26–2024-09-20.

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader текста учебника М. Я. Цузмера "Зоология" (1933) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с переводами на коми, коми-пермяцкий и удмуртский языки.
  3. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  4. Сканирование и распознавание в программе ABBYY FineReader текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).
  5. Cканирование, распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания "Г. Кржижановский. Великий Ленин" (1956), проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с коми переводом.
  6. Сборка текстов новостной ленты официального портала РК на русском языке за январь-июль 2024 г. и выравнивание данных текстов на коми и русском языках в программе WinMerge.
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№34-38), журнала "Войвыв кодзув" (2024. №№3, 4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№105-110 и их обработка в программе LibreOffice Writer.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов  журнала "Комі му" (1924. №№7-10),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 2-3.07.2024 c сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  12. Перевод на коми язык с помощью телеграм-бота новостных текстов за 3.07.2024 c сайта komiinform.ru и редактирование коми текстов для включения в базу переводчика.
  13. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  14. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".
  15. Сборка текстов переводов, сделанных для МКАО "Яндекс".
  16. Работа по унификации лексики и орфографии в текстах для переводчика.
  17. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": заполнение транскрипции, оформление отступов.
  18. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий изданий: "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика XI" (2006). "Пермистика XIV" (2012).
  19. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".
  20. Работа по созданию сайта "Пермистика".
  21. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  22. Распространение комиязычного контента в соц. сетях.
  23. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.16.-2024.09.20

опубликовал Öньö Лав в 12:00 20.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.16.-2024.09.20.

  1.  
  2. Завершение перевода с помощью телеграм-бота на коми язык новостных текстов за 2-3.07.2024 c сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  3. Перевод с помощью телеграм-бота на коми язык новостных текстов за 3.07.2024 c сайта komiinform.ru и редактирование коми текстов для включения в базу переводчика.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №38); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Завершение выравнивания текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г. в программе WinMerge.
  6. Сканирование в программе ABBYY FineReader книги В. Лодыгина "Габовсаяс" (2015) на коми языке и создание электронной копии в формате pdf.
  7. Распоознавание и вычитка в программе ABBYY FineReader книги В. Лодыгина "Габовсаяс" (Сыктывкар, 2015) на коми языке.
  8. Продолжение сборки текстов переводов, сделанных для МКАО "Яндекс".
  9. Работа по унификации лексики и орфографии в текстах для переводчика.
  10. Работа по созданию сайта "Пермистика".
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.09.-2024.09.13

опубликовал Öньö Лав в 11:57 13.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.09.-2024.09.13.

  1.  
  2. Завершение распознавания и вычитка в программе ABBYY FineReader текста учебника М. Я. Цузмера "Зоология" (1933) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с переводами на коми, коми-пермяцкий и удмуртский языки.
  3. Прирбретение, сканирование, распознавание и вычитка в программе ABBYY FineReader текста книги Г. Кржижановского "Великий Ленин" (1956) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с коми переводом.
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№36,37); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№105-110 и их обработка в программе LibreOffice Writer.
  6. Сборка текстов новостной ленты официального портала РК на русском языке за январь 2024г. - июль 2024г.
  7. Выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024г. - июль 2024г. в программе WinMerge.
  8. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  9. Предварительная сборка текстов переводов, сделанных для МКАО "Яндекс".
  10. Работа по унификации лексики и орфографии в текстах для переводчика.
  11. Продолжение распознавания и вычитки в программе ABBYY FineReader текста коми-пермяцкого издания на латинице: "M. J. Cuzmer. Zoologia" (1934).
  12. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.02.-2024.09.06.

опубликовал Öньö Лав в 22:01 05.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.02.-2024.09.06.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий изданий: "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика XI" (2006). "Пермистика XIV" (2012).
  3. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  4. Начало распознавания в программе ABBYY FineReader текста учебника "М. Я. Цузмер. Зоология" (1933) на русском языке.
  5. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Работа по унификации лексики и орфографии в текстах для переводчика.
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.08.26.-2024.08.30.

опубликовал Öньö Лав в 16:49 29.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.26.-2024.08.30.

  1.  
  2. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№34, 35), журнала "Войвыв кодзув" (2024. №№3, 4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)";
  5. Перевод на коми язык с помощью телеграм-бота новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов  журнала "Комі му" (1924 №№7-10),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  7. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  8. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": заполнение транскрипции, оформление отступов.
  9. Распространение комиязычного контента в соц. сетях.
2024ʼ моз тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:05 21.08.2024

2024-07-22–2024-08-23.

 

  1.  
  2. Приобретение русскоязычного издания "М. Я. Цузмер. Зоология. Учебник для средней школы. 6-7 годы обучения (1933)" в целях дальнейшего распознавания и выравнивания с коми-зырянским, коми-пермяцким и удмуртским переводами.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии изданий: "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Рассказы о Дзержинском" (1952),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "В. Гюго. Девяносто третий" (1937). "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)", "Пермистика-12" (2008), "Пермистика-13" (2012).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "Ю. Ермолаев. Гажа висьтъяс" (1963), "И. Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); обработка данных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий: "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952); обработка данных текстов в программе LibreOffice Writer.
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); обработка распознанных текстов в программе LibreOffice Writer.
  7. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "M. J. Cuzmer. Zoologia" (1934).
  8. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937)
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №11), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№94-104 и их обработка в программе LibreOffice Writer.
  11. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№27-33), журналов "Йӧлӧга (2024. №6) и "Войвыв кодзув" (2024. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке:  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)".
  13. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  14. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г.
  15. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.
  16. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  17. Распределение дополнительного материала для перевода текстов, предоставленных компанией "Яндекс".
  18. Завершение  вторичной разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab", размещение словаря на сайте; техническая разметка словаря: замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции.
  19. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  20. Распространение комиязычного контента в соц. сетях.
  21. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  22. Продление на годичный срок доменного имени komikyv.org.
FU-Lab. 2024.08.19.-2024.08.23.

опубликовал Öньö Лав в 16:33 21.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.19.-2024.08.23.

  1.  
  2. Приобретение русскоязычного издания "М. Я. Цузмер. Зоология. Учебник для средней школы. 6-7 годы обучения (1933)" в целях дальнейшего распознавания и выравнивания с коми-зырянским, коми-пермяцким и удмуртским переводами.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  4. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "M. J. Cuzmer. Zoologia" (1934).
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№32, 33), журналов "Йӧлӧга (2024. №6) и "Войвыв кодзув" (2024. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  7. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.
  8. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2024.08.12.-2024.08.16.

опубликовал Öньö Лав в 20:16 15.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.12.-2024.08.16.

 

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии издания: "Ю. Герман. Рассказы о Дзержинском" (1952). 
  3. Распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания: "Ю. Герман. Рассказы о Дзержинском" (1952), комиязычного издания "Г. Кржижановский. Великӧй Ленин" (1958); проверка орфографии, обработка распознанного текста в программе LibreOffice Writer для дальнейшего выравнивания с переводным русскоязычным текстом для параллельного корпуса коми языка.
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№29, 31); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г.
  6. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  7. Редактирование "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-lab".
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика