FU-Lab. 2024.05.13.-2024.05.17.

опубликовал Öньö Лав в 21:35 16.05.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.05.13.-2024.05.17.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953); комиязычных изданий: "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937).
  3. Распознавание и вычитка в программе ABBYY FineReader, проверка орфографии, обработка в программе LibreOffice Writer текстов коми изданий: "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов.  Мечта" (1957).
  4. Распознавание и вычитка в программе ABBYY FineReader, проверка орфографии, обработка в программе LibreOffice Writer рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956).
  5. Завершение проверки орфографии, обработка распознанных текстов коми издания "А. Новиков-Прибой. Цусима (мӧд книга)" (1948).
  6. Разбивка по предложениям и первичное выравнивание в программе WinMerge коми текстов с русским оригиналом: "В. Овечкин.  Передньӧй крайын" (1954), Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941).
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №17-20) и номера газеты "Выль туйӧд" (2022 год. №42); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №6 ), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.
  11. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.05.06.-2024.05.08.

опубликовал Öньö Лав в 12:52 08.05.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.05.06.-2024.05.08.

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе  LibreOffice Writer текстов русскоязычных изданий: "И. Н. Шевченко. Арифметика" (1959), "А. Барбюс. Огонь" (1936).
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе  LibreOffice Writer текстов комиязычных изданий: "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957).
  4. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  5. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  6. Распространение комиязычного контента в соц. сетях.
  7. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.04.27.-2024.05.03.

опубликовал Öньö Лав в 20:10 02.05.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.04.27.-2024.05.03.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычного издания: "О. Б. Лепешинская. Клетка и ее происхождение" (1951); комиязычных изданий: "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941).
  3. Распознавание и вычитка в программе ABBYY Fine Reader русскоязычных текстов: "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959).
  4. Разбивка на строки по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge  текстов коми изданий: "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №5 ), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.
  7. Начало предварительной разметки электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».
  8. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 21:19 23.04.2024

2024-03-25–2024-03-26.
    

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычный изданий:  "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954)", "Шӧр нэмъяслӧн история (1941)", "Е. А. Косминский. Средньӧй векъяслӧн история" (1951).
  3. Сканирование и создание pdf копий русскоязычных изданий, с которых были сделаны коми переводы: "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога : рассказы польских писателей" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957)", М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935) для дальнейшей работы по выравниванию оригинальных текстов с коми переводами.
  4. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов переводных изданий: "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история (1941)", "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY Fine Reader текстов русскоязычных изданий, имеющих коми эквиваленты: "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940).
  6. Выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текстов переводных изданий "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), " А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз", "А. Додэ. Тарасконса Тартарен" (1940),  "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963).
  7. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе  LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.
  8. Редактирование машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  9. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №12-16) и номеров газеты "Выль туйӧд" (2022 год. №№ 2-10, 12-16, 18, 20-27, 28, 31, 33, 34); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" за 1926-01-01, 1926-01-09, 1926-01-16 и 1926-01-24, газеты "Југыԁ туј" (1926. №19, 20) и журнала "Комі му" (1924. №3 и №4-6),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Пополнение коми монокорпуса и параллельного русско-коми корпуса текстами, обработанными в лаборатории за последнее время.
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін"  отдельных страниц по книжным изданиям на коми языке: "Би (А. Барбюс, 1941ʼ  вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми  ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг), Ботаника (1952ʼ вося небӧг), Гажа мойдъяс (1948ʼ вося небӧг), География (4-ӧд класслы 1956ʼ вося небӧг)‎‎, География кузя лыддьысян книга (1957ʼ вося небӧг), Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг), Зоология (1952ʼ вося небӧг)‎‎, Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг), Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг), Руч да кӧч (1959ʼ вося небӧг), Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг), СССР-лӧн география (1957ʼ вося небӧг), СССР-лӧн история (1963ʼ вося небӧг)‎‎, Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг), Тема да Жучка (1954ʼ вося небӧг), Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг), Январь 9-ӧд лун (М. Горький , 1958ʼ вося небӧг).
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по последним номерам журнала "Войвыв кодзув" (2023. №№ 6-12; 2024. №№ 1-3).
  14. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  15. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  16. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  17. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  18. Распространение комиязычного контента в соц. сетях.
  19. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  20. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).
  21. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения  с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).
FU-Lab. 2024.04.22.-2024.04.26.

опубликовал Öньö Лав в 21:12 23.04.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.04.22.-2024.04.26.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957)", М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935) для дальнейшей работы по выравниванию текстов оригиналов с коми переводами.
  3. Распознавание и вычитка  в программе ABBYY FineReader текстов комиязычных изданий "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957) и русскоязычных изданий "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940).
  4. Разбивка на строки по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge  текстов коми изданий "О. Туманян. Кӧзяин да работник" (1952), "М. Горькӧй. Мойдъяс" (1952), "Н. Гарин. Тема да Жучка" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "М. Горький. Январь 9-ӧд лун" (1958), "Е. Д. Стасова. Татшӧм вӧлі Владимир Ильич Ленин" (1966), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "А. Фадеев. Метелица" (1954), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963).
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №16) и номеров газеты "Выль туйӧд" (2022 год. №№ 36, 37, 39, 40); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" (1926. №20) и журнала "Комі му" (1924. №4-6), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.04.15.-2024.04.19.

опубликовал Öньö Лав в 23:56 18.04.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.04.15.-2024.04.19.

  1.  
  2. Приобретение, сканирование и создание pdf копий русскоязычных изданий:  "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога : рассказы польских писателей" (1953) для дальнейшего выравнивания с коми переводами.
  3. Распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе  LibreOffice Writer коми текстов переводных изданий:  "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), а также русскоязычного издания  "А. Додэ. Тартарен из Тараскона" (1938).
  4. Разбивка коми и русского текстов  на строки и первичное выравнивание в программе WinMerge  изданий "Д. Медведев. Ыджыд сьӧлӧма йӧз" ("Сильные духом"), "А. Додэ. Тарасконса Тартарен" ("Тартарен из Тараскона").
  5. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе  LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №15) и номеров газеты "Выль туйӧд" (2022 год. №№ 31, 33, 34); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Редактирование машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" (1926. №19) и журнала "Комі му" (1924. №3), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін"  отдельных страниц по книжным изданиям на коми языке: Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг), Ботаника (1952ʼ вося небӧг), Гажа мойдъяс (1948ʼ вося небӧг), География (4-ӧд класслы 1956ʼ вося небӧг)‎‎, География кузя лыддьысян книга (1957ʼ вося небӧг), Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг), Зоология (1952ʼ вося небӧг)‎‎, Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг), Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг), Руч да кӧч (1959ʼ вося небӧг), Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг), СССР-лӧн география (1957ʼ вося небӧг), СССР-лӧн история (1963ʼ вося небӧг)‎‎, Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг), Тема да Жучка (1954ʼ вося небӧг), Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг), Январь 9-ӧд лун (М. Горький , 1958ʼ вося небӧг).
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по последним номерам журнала "Войвыв кодзув" (2023. №№ 6-12; 2024. №№ 1-3).
  11. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  15. Проведение мастер-класса  в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения  с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (2024-04-13).
FU-Lab. 2024.04.08.-2024.04.12.

опубликовал Öньö Лав в 16:08 11.04.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.04.08.-2024.04.12.

 

  1.  
  2. Заказ 11 русскоязычных книг, с которых был сделан перевод на коми язык, для дальнейшего выравнивания русского и коми текстов.
  3. Приобретение, сканирование и создание pdf копии русскоязычного издания "Чу Чэн. Тайна разрушенного храма" (1958); распознавание и вычитка текста данного издания в программе ABBYY FineReader, его обработка в программе LibreOffice Writer, разбивка на предложения и выравнивание с ранее распознанным переводом на коми язык в программе WinMerge.
  4. Распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе  LibreOffice Writer коми текстов переводных изданий: "Шӧр нэмъяслӧн история (1941)", "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953).
  5. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом коми перевода изданий "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951).
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №14) и номеров газеты "Выль туйӧд" (2022 год. №№ 22, 23, 24, 25, 26, 27, 28); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" за 1926-01-16 и 1926-01-24, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін"  отдельных страниц по книжным изданиям на коми языке: "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)"‎.
  9. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.03.29.-2024.04.03.

опубликовал Öньö Лав в 11:33 04.04.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.03.29.-2024.04.03.

  1.  
  2. Приобретение, сканирование и создание pdf копий русскоязычных изданий "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953).
  3. Распознавание и вычитка текстов указанных в предыдущем пункте изданий в программе ABBYY FineReader, обработка их в программе LibreOffice Writer, разбивка на предложения и выравнивание с ранее распознанными переводами на коми язык в программе WinMerge.
  4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычный изданий:  "Шӧр нэмъяслӧн история (1941)", "Е. А. Косминский. Средньӧй векъяслӧн история" (1951).
  5. Завершение распознавания и вычитки в программе ABBYY Fine Reader, обработки в программе  LibreOffice Writer коми текстов переводных изданий:  "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954).
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №13) и номеров газеты "Выль туйӧд" (2022 год. №№ 12, 13,14, 15, 16, 18, 20, 21); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" за 1926-01-01 и 1926-01-09, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  12. Участие  в Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).
FU-Lab. 2024.03.25.-2024.03.29.

опубликовал Öньö Лав в 10:41 29.03.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.03.25.-2024.03.29.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Приобретение русскоязычных изданий, с которых были сделаны коми переводы: "А. Додэ. Тартарен из Тараскона" (1938), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952) для выравнивания текстов с коми переводом и включения в параллельный корпус.
  4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычного издания:  "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954)".
  5. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов переводных изданий:  "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с переводным русскоязычным текстом для параллельного корпуса коми языка.
  6.  Распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer  русскоязычных изданий: "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), выравнивание по предложениями русскоязчных текстов с коми переводами в программе WinMerge .
  7. Выравнивание по предложения в программе WinMerge коми перевода издания " А. Гончар. Знаменосецъяс" (1955) с русскоязчыным оригиналом.
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №12) и номеров газеты "Выль туйӧд" (2022 год. №№ 2, 3, 4, 5, 6, 7, 8, 9, 10); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Пополнение коми монокорпуса и параллельного русско-коми корпуса текстами, обработанными в лаборатории за последнее время.
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін"  отдельных страниц по книжным изданиям на коми языке: "Би (А. Барбюс, 1941ʼ  вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми  ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)".
  11. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  12. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  13. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ воысь медводдза квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 1:20 22.03.2024

2. Работа в рамках создания параллельного корпуса (kv-ru), автоматического переводчика, локализации сайтов и программ:

2.1. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копии русскоязычных изданий: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936) для последующего выравнивания с коми переводом.

2.2. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.3. Распознавание и вычитка в программе ABBYY FineReader русских оригиналов учебников "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947); "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

2.4. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), а также pdf-копии русскоязычных оригиналов изданий  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959).

2.5. Выравнивание по предложениям в программе WinMerge коми текстов с русским оригиналом: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945).

2.6. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

2.7. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь - декабрь 2023 г., их выравнивание и включение в параллельный корпус.

2.8. Пополнение параллельного русско-коми корпуса текстами, обработанными в лаборатории с начала текущего года.

2.9. Сбор новостных текстов сайтов komiinform.ru и  bnkomi.ru,  перевод их  с помощью телеграм-бота на коми язык; выравнивание коми и русских текстов в программе WinMerge с редактирование коми текстов для включения в  базу переводчика.

2.10. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.

2.11. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.12. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.13. Подбор материала для перевода на коми язык из массива корпуса текстов, предоставленных OOO «Яндекс».

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader книги О. Шлоповой "Туръяса мойдъяс да висьтъяс"; "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959).

3.2. Распознавание в программе ABBYY FineReader коми текстов изданий "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-август 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-05, 1990-07-07, 1990-09-10, 1990-07-12, 1990-07-14, 1990-07-17, 1990-07-19, 1990-07-21, 1990-07-24 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-11), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1, 2) и "Войвыв кодзув" (2023 №№11-12; 2024 №1), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газет "Југыԁ туј" за 1925-10-15, 1925-10-17, 1925-10-20, 1925-10-23, 1925-10-28, 1925-10-31, 1925-11-10, 1925-11-12, 1925-11-18, 1925-11-25, 1925-12-01, 1925-12-08, 1925-12-15 и "Комі ԍікт" за  1925-10-24, 1925-11-07, 1925-11-14, 1925-11-21, 1925-11-28, 1925-12-05, 1925-12-12, 1925-12-18, 1925-12-25, их обработка в программе LibreOffice Writer и добавление в молодцовский корпус;

5. Пополнение и оптимизация структуры онлайн библиотеки "Коми гижӧд":

5.1. Перевод на современную графику и размещение в онлайн библиотеке "Коми гижӧд" текстов 13 номеров газеты  "Југыԁ туј" и 9 номеров газеты "Комі ԍікт" за 1925 год.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939).

6.2. Создание ссылок на авторов сборника статей «... Коми йӧз кывйӧн нэм кежлӧ пасйыны» (2005) на странице "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)" и пополнение отдельных страниц некоторых авторов коми текстов.

6.3. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-2).

6.4. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.5. Создание и заполнение wiki-страниц с оглавлением по 22 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".

7. Создание мультиязычного корпуса по пермским языкам:

7.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

8. Помощь коллегам в регионах:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Оптимизация основных сайтов fu-lab.ru.

12.1. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

12.2. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

13. Иное

13.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

13.2. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.

13.3. Распространение комиязычного контента в соц. сетях.

13.4. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

14. Участие в мероприятиях и выступления в сми:

14.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

14.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

14.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

14.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

2024ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:08 20.03.2024

2024-02-23–2024-03-23.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959). 
  4. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936) для последующего выравнивания с коми переводом.
  5. Распознавание и вычитка в программе ABBYY FineReader комиязычных изданий "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с переводным русскоязычным текстом для параллельного корпуса коми языка.
  6. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов изданий "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945).
  7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  8. Выравнивание по предложениям в программе WinMerge коми текстов с русским оригиналом: "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945). 
  9. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№8-11) и журнала "Йӧлӧга" (2024. №2), а также  номеров газеты "Выль туйӧд" (2021. №№ 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  10. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.
  11. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-21, 1990-07-24 и их обработка в программе LibreOffice Writer.
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939).
  13. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газет "Југыԁ туј" за 1925-12-08, 1925-12-15 и "Комі ԍікт" за 1925-12-05, 1925-12-12, 1925-12-18, 1925-12-25, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  14. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  15. Создание бота для автоматизации запросов к переводчику.
  16. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  17. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  18. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  19. Распространение комиязычного контента в соц. сетях.
  20. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  21. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор").
FU-Lab. 2024.03.18.-2024.03.22.

опубликовал Öньö Лав в 19:49 20.03.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.03.18.-2024.03.22.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959).
  4. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов переводных изданий: "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с переводным русскоязычным текстом для параллельного корпуса коми языка.
  5. Продолжение выравнивания по предложениям в программе WinMerge коми текста с русским оригиналом: "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955).
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №11) и номеров газеты "Выль туйӧд" (2021. №№ 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 год №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-21, 1990-07-24 и их обработка в программе LibreOffice Writer.
  8. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копии русскоязычного издания: "Р. Джованьоли. Спартак" (1936) для последующего выравнивания с коми переводом.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" за 1925-12-25 , их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  11. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.03.11.-2024.03.15.

опубликовал Öньö Лав в 21:16 14.03.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.03.11.-2024.03.15.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963).
  4. Завершение распознавания и вычитки в программе ABBYY FineReader русскоязычного текста учебника "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952); обработка распознанного текста в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии).
  5. Начало распознавания и вычитки в программе ABBYY FineReader комиязычного текста "Л. Жариков. Суровӧй друг йылысь повесть" (1953).
  6. Выравнивание по предложениям в программе WinMerge коми текстов с русским оригиналом: "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945). 
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№9, 10) и номеров газеты "Выль туйӧд" (2021. №№ 35, 36, 37, 38, 39, 41); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №3-5) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" за 1925-12-18, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  11. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  15. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор").
FU-Lab. 2024.03.04.-2024.03.07.

опубликовал Öньö Лав в 9:50 07.03.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.03.04.-2024.03.07.

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Распознавание и вычитка в программе ABBYY FineReader комиязычных изданий "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  4. Продолжение распознавания и вычитки в программе ABBYY Fine Reader русскоязычного текста учебника "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952).
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №8) и журнала "Йӧлӧга" (2024. №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Перевод текстов газеты "Коми му" (2024. №1, 2) на русский язык для пополнения текстовой базы русско-коми переводчика.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газет "Југыԁ туј" за 1925-12-08, 1925-12-15 и "Комі ԍікт" за 1925-12-05, 1925-12-12, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.02.26.-2024.03.01.

опубликовал Öньö Лав в 20:02 29.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.02.26.-2024.03.01.

 

  1.  
  2. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940).
  4. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копии русскоязычного издания: "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952).
  5. Распознавание и вычитка в программе ABBYY FineReader комиязычных изданий "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  6. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов изданий "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945).
  7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  8. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  9. Адаптивная HTML-вёрстка новой структуры сайтов fu-lab.ru.
  10. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  11. Создание бота для автоматизации запросов к переводчику.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ урасьӧмся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:18 23.02.2024

2024-01-25–2024-02-22.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), также  русскоязычного издания "Б. В. Всесвятский. Ботаника" (1957)
  3. Распознавание в программе ABBYY FineReader коми текстов изданий "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Распознавание и вычитка в программе ABBYY FineReader русских оригиналов учебников "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Поиск в сети Интернет" и сбор текстов русскоязычных оригиналов комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), а также pdf-копии русскоязычных оригиналов изданий  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959).
  6. Выравнивание по предложениям в программе WinMerge коми текстов с русским оригиналом: "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959).
  7. Завершение первичного выравнивания комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») в программе WinMerge и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.
  8. Завершение выравнивания новостных текстов сайта komiinform.ru на русском языке с ранее сделанным коми переводом в программе WinMerge и редактирования коми текстов для включения в базу переводчика.
  9. Сбор новостных текстов сайта bnkomi.ru и перевод их  с помощью телеграм-бота на коми язык; выравнивание коми и русских текстов в программе WinMerge с редактирование коми текстов для включения в  базу переводчика.
  10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.
  11. Создание фотокопий статей номеров газеты "Югыд туй" за июль-август 1990 года.
  12. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-05, 1990-07-07, 1990-09-10, 1990-07-12, 1990-07-14, 1990-07-17, 1990-07-19 и их обработка в программе LibreOffice Writer.
  13. Извлечение из pdf файлов текстов номеров газеты "Коми му" (2024. №№1-7) и "Выль туйӧд" (2021 №№ 31, 32, 33), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №1) и "Войвыв кодзув" (2023 №№11-12; 2024 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).  
  14. Выравнивание текстов новостной ленты официального портала РК rkomi.ru на коми и русском языках за сентябрь-декабрь 2023 г. для включения в параллельный корпус.
  15. Пополнение корпуса коми языка  и параллельного русско-коми корпуса текстами, обработанными в лаборатории с начала текущего года.
  16. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газет "Југыԁ туј" за 1925-11-10, 1925-11-12, 1925-11-18, 1925-11-25, 1925-12-01 и "Комі ԍікт" за 1925-11-14, 1925-11-21, 1925-11-28, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  17. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959).
  18. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  19. Исправление удмуртской сортировки на сайте Онлайн словари FU-Lab.
  20. Разработка новой структуры основного сайта fu-lab.ru.
  21. Адаптивная HTML-вёрстка новой структуры сайта fu-lab.ru.
  22. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  23. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  24. Распространение комиязычного контента в соц. сетях.
  25. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  26. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).
  27. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).
  28. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).
FU-Lab. 2024.02.19.-2024.02.22.

опубликовал Öньö Лав в 15:28 20.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.02.19.-2024.02.22.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий:  "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952).
  3. Поиск и сбор текстов русскоязычных оригиналов комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959). Выравнивание коми и русских эквивалентов в программе WinMerge.
  4. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-14, 1990-07-17, 1990-07-19 и их обработка в программе LibreOffice Writer.
  5. Извлечение из pdf файлов текстов номеров газет "Коми му" (2024. №7) и "Выль туйӧд" (2021 №№ 31, 32, 33), журнала "Войвыв кодзув" (2023. №11) ; обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader текста учебника "А. В. Мишулин. История Древнего мира" (1947) на русском языке, проверка орфографии, обработка распознанных текстов в LibreOffice Writer для дальнейшего выравнивания с переводным комиязычным текстом для параллельного корпуса коми языка .
  7. Распознавание и вычитка в программе ABBYY Fine Reader комиязычного текста учебника "С. А. Пономарёва, Н. И. Сырнева. Арифметика кузя задачаяс да упражнениеяс сборник" (1955).
  8. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  9. Адаптивная HTML-вёрстка новой структуры сайта fu-lab.ru.
  10. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024).
FU-Lab. 2024.02.12.-2024.02.16.

опубликовал Öньö Лав в 20:04 15.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.02.12.-2024.02.16.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959). 
  3. Распознавание в программе ABBYY FineReader коми текстов изданий, указанных в предыдущем пункте; обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №6), журналов "Йӧлӧга" (2023. №№11, 12) и "Войвыв кодзув" (2023 №11, 2024 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader комиязычного текста учебника "Б. В. Всесвятский. Ботаника" (1940); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959). 
  7. Завершение перевода с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-12-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  10. Адаптивная HTML-вёрстка новой структуры сайта fu-lab.ru.
  11. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  12. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  15. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми".
FU-Lab. 2024.02.05.-2024.02.09.

опубликовал Öньö Лав в 6:31 09.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.02.05.-2024.02.09.

  1.  
  2. Распознавание в программе ABBYY FineReader комиязычного текста учебника  "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955).
  3. Выравнивание по предложениям в программе WinMerge коми текста с русским оригиналом учебника "Б. В. Всесвятский. Ботаника" (1957).
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №5) и "Йӧлӧга" (2024. №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Создание фотокопий статей номеров газеты "Югыд туй" за июль-август 1990 года.
  6. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-05, 1990-07-07, 1990-09-10, 1990-07-12 и их обработка в программе LibreOffice Writer.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-11-12, 1925-11-18 и 1925-11-25, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Пополнение корпуса коми языка текстами, обработанными в лаборатории с начала текущего года.
  9. Перевод на коми язык с помощью телеграм-бота контрольных текстов для переводчика с последующим редактированием.
  10. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь-декабрь 2023 г. для включения в параллельный корпус.
  11. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.
  12. Исправление удмуртской сортировки на сайте Онлайн словари FU-Lab.
  13. Разработка новой структуры основного сайта fu-lab.ru.
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.01.29.-2024.02.02.

опубликовал Öньö Лав в 21:36 01.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.01.29.-2024.02.02.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), также  русскоязычного издания "Б. В. Всесвятский. Ботаника" (1957).
  3. Распознавание в программе ABBYY FineReader коми текстов учебников "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), а также русских оригиналов учебников "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  4. Выравнивание по предложениям в программе WinMerge коми текстов с русским оригиналом учебников: "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963) для параллельного корпуса.
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№1-4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Сбор новостных текстов сайта bnkomi.ru и перевод с помощью телеграм-бота на коми язык; Выравнивание новостных текстов сайта bnkomi.ru на коми и русском  языках в программе WinMerge и редактирование коми текстов для включения в  базу переводчика.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газет "Југыԁ туј" за 1925-11-10 и "Комі ԍікт" за 1925-11-14, 1925-11-21, 1925-11-28, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.01.22.-2024.01.26.

опубликовал Öньö Лав в 21:05 01.02.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.01.22.-2024.01.26.

  1.  
  2. Завершение выравнивания новостных текстов сайта komiinform.ru на коми и русском языках в программе WinMerge и редактирования коми текстов для включения в базу переводчика.
  3. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов учебников "В. А. Тетюрёв. Ботаника" (1949), "Ф. П. Коровкин. История древнего мира" (1962), проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с переводным комиязычным текстом для параллельного корпуса коми языка и последующего включения в базу переводчика.
  4. Завершение первичного выравнивания комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») в программе WinMerge.
  5. Перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.
  6. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ тӧвшӧрся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:47 24.01.2024

2023-12-25–2024-01-24.

 

  1. Сканирование в программе ABBYY FineReader книги О. Шлоповой "Туръяса мойдъяс да висьтъяс"; "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963).
  2. Распознавание коми текстов изданий "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951) в программе ABBYY FineReade.
  3. Выравнивание коми текстов "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969) с русским оригиналом в программе WinMerge для параллельного корпуса.
  4. Модернизация комиязычных текстов учебника "Баранский Н. Н. СССР-лӧн физическӧй география" (1939), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957) для включения в базу переводчика и портал "Коми мутӧдӧм".
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь - декабрь 2023 г. для дальнейшего выравнивания и включения в параллельный корпус; выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь - август 2023 г. и включение их параллельный корпус.
  7. Перевод с помощью телеграм-бота новостных текстов сайта komiinform.ru на коми язык, выравнивание текстов на коми и русском языках в программе WinMerge и редактирование коми текстов для пополнения текстовой базы русско-коми переводчика.
  8. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса.
  9. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.
  10. Подбор материала для перевода на коми язык из массива корпуса текстов, предоставленных OOO «Яндекс».
  11. Выравнивание в программе WinMerge текстов произведений Елены Козловой на коми языке с их русскими переводами для параллельного корпуса и переводчика.
  12. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках.
  13. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.
  14. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.
  15. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-15, 1925-10-17, 1925-10-20, 1925-10-23, 1925-10-24 (приложение "Комі ԍікт"), 1925-10-28, 1925-10-31, 1925-11-07 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  16. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)". Создание ссылок на авторов сборника статей «... Коми йӧз кывйӧн нэм кежлӧ пасйыны» (2005) на странице "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)" и пополнение отдельных страниц некоторых авторов коми текстов.
  17. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-2).
  18. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.
  19. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.
  20. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.
  21. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  22. Распространение комиязычного контента в соц. сетях.
  23. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  24. Изучение языка программирования Python.
FU-Lab. 2024.01.15.-2024.01.19.

опубликовал Öньö Лав в 0:30 19.01.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.01.15.-2024.01.19.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963).
  3. Распознавание коми текста учебника "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957) в программе ABBYY FineReader, его выравнивание с русским оригиналом в программе WinMerge для параллельного корпуса, модернизация коми текста для текстовой базы переводчика и портала "Коми мутӧдӧм".
  4. Выравнивание в программе WinMerge текстов произведений Елены Козловой на коми языке с их русскми переводами для параллельного корпуса и переводчика.
  5. Завершение выравнивания и корректура текстов новостной ленты официального портала РК на коми и русском языках за январь - август 2023 г. и их включение в параллельный корпус.
  6. Перевод с помощью телеграм-бота новостных текстов сайта komiinform.ru на коми язык, выравнивание текстов на коми и русском языках в программе WinMerge и редактирование коми текстов для пополнения текстовой базы русско-коми переводчика.
  7. Пополнение параллельного корпуса и текстовой базы переводчка первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-11-07 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  12. Изучение языка программирования Python.
FU-Lab. 2024.01.09.-2024.01.12.

опубликовал Öньö Лав в 21:06 11.01.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.01.09.-2024.01.12.

  1.  
  2. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.
  3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь - август 2023 г. для включения в параллельный корпус.
  4. Сканирование в программе ABBYY FineReader книги О. Шлоповой "Туръяса мойдъяс да висьтъяс" ("Туръинские рассказы и сказки") (2004) на коми и русском языках и создание электронной копии в формате pdf;
  5. Модернизация комиязычных текстов учебника "Баранский Н. Н. СССР-лӧн физическӧй география" (1939) для включения в базу переводчика и портал "Коми мутӧдӧм".
  6. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русскоми языках для коллег в других регионах, занимающихся аналогичной работой.
  7. Подбор материала для перевода на коми язык из массива корпуса текстов, предоставленных OOO «Яндекс».
  8. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-23, 1925-10-24 (приложение "Комі ԍікт"), 1925-10-28 и 1925-10-31, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Изучение языка программирования Python.
FU-Lab. 2023.12.25.-2023.12.29.

опубликовал Öньö Лав в 16:25 28.12.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.12.25.-2023.12.29.

  1.  
  2. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь - декабрь 2023 г. для дальнейшего выравнивания и включения в параллельный корпус.
  3. Модернизация комиязычного текста учебника "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1963)"  для базы автоматического переводчика и портала "Коми мутӧдӧм".
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Завершение редактирования новостных текстов радио "Коми гор" за 2018 г. для Корпуса коми языка.
  6. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного Корпуса коми языка.
  7. Распознавание и вычитка в программе ABBYY FineReader текста книги Г. М. Кржижановского "Шу-шу" (1969) на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  8. Разбивка текстов книги Г. М. Кржижановского "Шу-шу" (1969) на строки по предложениям и первичное выравнивание русского и коми контента в программе WinMerge.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-15, 1925-10-17 и 1925-10-20, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)". Создание ссылок на авторов сборника статей «... Коми йӧз кывйӧн нэм кежлӧ пасйыны» (2005) на странице "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)" и пополнение отдельных страниц некоторых авторов коми текстов.
  11. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.
  12. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.
  13. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  16. Изучение языка программирования Python.
2023ʼ вося отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 19:46 19.12.2023

2. Работа в рамках создания автоматического переводчика, параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Создание модели двуязычной нейронной сети Sockeye и разработка прототипа машинного переводчика с русского языка на коми. Тестирование различных веток переводчика.

2.2. Выборочный перевод  с русского языка на коми язык новостных текстов федеральных средств массовой информации (РБК, Интерфакс, Коммерсант) для параллельного корпуса ru-kv.

2.3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.

2.4. Перевод с русского языка на коми язык стабильных текстов официальных сайтов администрации и совета МОГО "Сыктывкар" и выравнивание коми и русских эквивалентов по предложениям в программе WinMerge.

2.5. Перевод на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.

2.6. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" (части 1 и 2, 2017 г.) и "Коми язык. 6 класс" (2018), обработка текстов (разбивка по предложениям, сортировка, устранение повторов) в программе LibreOffice Writer, выравнивание коми и русских эквивалентов в программе WinMerge и включения в базу параллельных текстов на коми и русском языках.

2.7. Выравнивание коми и русского материала радио "Коми гор" за 2014-2020 гг. по метаразметкам. Вычленение русскоязычного новостного массива  за 2018 г., корректирование русского текста за 2017 год.

2.8.  Сборка и предварительная обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг.; создание метаразметок к текстам оригинала и выравнивание документов на двух языках по предложениям для параллельного корпуса.

2.9. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года; аналогичная работа произведена с учебными текстами "Л. Г. Терехова, В. Г. Эрдели. География : учебник для четвертого класса начальной школы" (1938/1939), "Н. Баранский. Физическая география СССР. Первая часть" (1935/1939), "С. Ф. Чефранов. Физическая география СССР. Районный обзор" (1937/1941), "А. Л. Колесников. Из чего состоит вселенная" (1953), "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958/1963)" и "Виткович Н. Е. География  (1955/1956)".

2.10.  Сборка русскоязычных текстов оригинала учебника "Родная речь. Книга для чтения во 2 классе" (1954).

2.11.  Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940),  "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Водопьянов. Полярнӧй лётчик" (1958), "В.  Ардаматский. Ме 11-17" (1963), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951), "С. Григорьев. Малахов курган" (1952), А. Гайдар "Лым крепостьса комендант" (1954), "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956), "Рӧднӧй сёрни: начальнӧй школаса мӧд  класслы лыддьысян книга" (1956), "Ю. Сотник. Кыдзи ме олі ас кежын" (1951), "А. Голубева. Уржумса детинка" (1951).

2.12.  Орфографическая и терминологическая модернизация коми текстов для переводчика.

2.13.  Редактирование словника коми-русского словаря для параллельного корпуса.

2.14. Обновление парсера разбивки на предложения с уточнением возможных контекстуальных исключений для русского и коми языков, и добавлением правил разбивки для удмуртского языка.

2.15. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.

2.16. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.

2.17. Локализация интерфейса desktop приложения менеджера Telegram на коми язык и начало локализации iOs и Android приложений менеджера Telegram.

2.18. Предварительная работа по локализации интерфейса браузера Mozilla FireFox на коми язык.

2.19. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.

2.20. Создание коми локали для операционной системы Simply Linux.

2.21. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954), С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953), "Н. Островский. Бушколын чужысьяс" (1957), "В. Каверин. Мужестволӧн школа" (1957), "И. Кожедуб. Служита Рӧдиналы" (1957), "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963), "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952), Ю. Збанацкий "Соколинӧй яглӧн тайна" (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956), "Венгр литератураысь 12 медся мича висьт" (2015), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) , "А. Авдеенко.  Карпатскӧй бипур дорын" (1962), Т. Гончаренко "Овтӧм ді вылын" (1962), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "Ф. В. Плесовский. Комиын овъяс" (1997), а также русскоязычного издания "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958)".

3.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий"М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948),   "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1955), "С. Григорьев. Малахов курган" (1952),  "В. Ардаматский. Ме 11-17" (1963) и "М. Водопьянов. Полярнӧй лётчик" (1958), "Александр Бек. Волоколамскӧй шоссе" (1948), "Иван Кожедуб. Служита Рӧдиналы" (1957), "В. Каверин. Мужестволӧн школа" (1957), "А. Пунченок. Испытание" (1953), "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "О.Коряков. Повтӧмъяслӧн трӧпаӧд" (1956), "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "А.  Авдеенко. Карпатскӧй бипур дорын" (1962), "Т. Гончаренко. Овтӧм ді вылын" (1962), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961),  "Ф. В. Плесовский. Комиын овъяс" (1997),"А. Голубева. Уржумса детинка" (1951),  "Виткович Н. Е. География : нач. школаса 4-ӧд кл. учебник" (1956) и  "Заславскӧй И. И., Герасимов Т. П. Физическӧй география : начальнӧй курс : семилетньӧй да средньӧй школаса 5-ӧд кл. учебник" (1963).

3.3. Сканирование в программе ABBYY FineReader недостающих страниц переводных книжных изданий на коми языке и дополнение их электронных копий в формате pdf: "Л. Кассиль. Менам дона детинкаяс" (1948), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1953), И. Василенко "Звёздочка" (1950), произведены рспознавание и вычитка данных страниц в программе ABBYY FineReader, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.

3.4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52;  2023. №1-51), журналов "Йӧлӧга" (2022. №№10, 11, 12, 2023. №1-10) и  "Войвыв кодзув" (2022. №№8-12, 2023. №1-10), а также изданий "Венгр литератураысь 12 медся мича висьт" (2015) и "Венгр литератураысь 50 медся мича кывбур" (2015); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).

3.5. Вычитка и корректирование коми новостного массива радио "Коми гор" за 2014-2020 гг. для корпуса коми языка с маркировкой повторных сообщений для последующего удаления из общего массива. Удаление повторов из новостных текстов радио "Коми гор" за 2019-2020 год и разделеление собственно новостей и радиорепортажей по разным файлам.

3.6. Создание метаразметок и обработка комиязычных текстов БОП, содержащих НПА РК за 2021 и 2022 годы для корпуса коми языка.

3.7. Распределение текстов переводных книжных изданий по четырем хронологически маркированным файлам в связи с критическим увеличением объёма общего файла.

3.8. Добавление в корпус коми языка текстов, обработанных за отчетный период.

4. Текстовое пополнение молодцовского и латинского корпусов:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 51 номера газеты "Југыԁ туј" за (1925-02-14,  1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07), 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14, 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, 1925-05-23, 1925-05-27,  1925-05-30,  1925-06-02,  1925-06-04, 1925-06-06 (приложение "Комі ԍікт"),  1925-06-11, 1925-06-13, 1925-06-16, 1925-06-18, 1925-06-20,  1925-06-23, 1925-06-25, 1925-06-27, 1925-06-30, 1925-07-04 (приложение "Комі ԍікт"), 1925-07-07, 1925-07-09, 1925-07-11 (приложение "Комі ԍікт"), 1925-07-14, 1925-07-16, 1925-07-18 (приложение "Комі ԍікт"), 1925-07-21, 1925-07-23, 1925-07-25 (приложение "Комі ԍікт"), 1925-07-30, 1925-08-01, 1925-08-04, 1925-08-06, 1925-08-08 (приложение "Комі ԍікт"), 1923-08-11, 1925-08-13, 1925-08-15 (приложение "Комі ԍікт"), 1925-08-18, 1925-08-20, 1925-08-22 (приложение "Комі ԍікт"), 1925-08-25, 1925-08-27, 1925-08-29 (приложение "Комі ԍікт"), 1925-09-01, 1925-09-03, 1925-09-05, 1925-09-08, 1925-09-10,  1925-09-12, 1925-09-15, 1925-09-17, 1925-09-19, 1925-09-22, 1925-09-24, 1925-09-26, 1925-09-29, 1925-10-01, 1925-10-03, 1925-10-04, 1925-10-06, 1925-10-08, 1925-10-10, 1925-10-13 и 1925-10-14;их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

4.2. Распознавание и вычитка в программе АВВYY FineReader молодцовских текстов изданий "100 комі ԍыланкыв" (1935), "Грімм вокјаслӧн мојԁјас" (1938), "Ԁ. Грігорович. Гуттаперчевӧј ԃеԏінка" (1938),  "Н. С. Шер. Ајна" (1936) для молодцовского корпуса.

4.3. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice Writer латинских текстов учебников "A. Ꞑ. Kaвanov. Mortlən anatomija da fiⱬiologija" (1934) и "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Заключение лицензионных договоров с правообладателями текстов авторов Раевский Степан Семенович, Касеева Клавдия Андреевна, Габов Прокопий Валентинович, Одинцов Алексей Серафимович, вычитка, корректировка и размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений данных авторов.

5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна.

5.3. Размещение в коми онлайн библиотеке «Коми гижӧд» аудиоматериала к текстам произведений Г. И. Попова.

5.4. Пополнение онлайн-библиотеки "Коми гижӧд" новыми произведениями автора Елена Афанасьева.

5.5. Добавление в онлай библиотеку переводной пьесы Н. Обрезковой "Гуманитарнӧй класс" по просьбе автора.

5.6. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 93 номеров газеты "Југыԁ туј" за 1925 г. в переводе на современную графику.

5.7. Перевод латинского текста учебника "Ꞑ. Rьвkin. Geometrijaьş zadaçajas sborņik" (1934) на современную графику и его размещение в онлайн библиотеке "Коми гижӧд".

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание авторской wiki-страницы и библиографии текстов авторов Габов П. В., Касеева К. А. и Анна Кучева, размещение ссылок на произведения, размещенные в библиотеке "Коми гижӧд".

6.2. Пополнение библиографии текстов автора Карманова К. И. на wiki-странице автора, добавление ссылок на новые произведения, размещенные в библиотеке "Коми гижӧд".

6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)", "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)", "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)", "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)",  "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)", "Служита Рӧдиналы (И. Кожедуб, 1957ʼ вося небӧг)", "Бушковын чужысьяс (Н. Островскӧй , 1957ʼ вося небӧг)", "Мужестволӧн школа (В. Каверин, 1957ʼ вося небӧг)",  "Енэжӧ содъяс (Надежда Павловалӧн 2016ʼ вося небӧг)", "Сьӧд вӧр шӧрын (А. Кучевалӧн 2023ʼ вося небӧг)", "Лемванырд (С. Терентьевлӧн 2008ʼ вося небӧг)", "Тӧвся войӧ (С. Терентьевлӧн 2022' вося небӧг)", "Пыж да лов (Е.  Афанасьевалӧн 2023ʼ вося небӧг)", "Лампа пӧч да Шурш (Л. Ануфриевалӧн 2023ʼ вося небӧг)", "Мӧд шонді (Л. Ануфриевалӧн 2022ʼ вося небӧг)", "Кумач морӧса жонь (А. Ванеевлӧн 2023ʼ вося небӧг)", "Сипсик — ловъя акань (Е. Цыпановлӧн 2023ʼ вося небӧг)", "Ю. Збанацкий. Соколинӧй яглӧн тайна"  (1956), "Повтӧмъяслӧн тропаӧд (О. Коряков, 1956ʼ вося небӧг)", "Рӧднӧй сёрни (2-ӧд класслы 1956ʼ вося небӧг)", "Рӧднӧй сёрни (4-ӧд класслы 1961ʼ вося небӧг)", "Том пӧра  коллялӧмӧй! (Е. А. Игушевлӧн 2023' вося небӧг)", "Овтӧм ді вылын (Т.И.  Гончаренко, 1962ʼ вося небӧг)", "Кыдзи ме олі ас кежын (Ю. Сотник, 1961ʼ  вося небӧг)", "Карпатскӧй бипур дорын (А. Авдеенко, 1962ʼ вося небӧг)", "Мый тӧда – сійӧс и висьтала (2014ʼ вося небӧг)".

6.4. Создание и заполнение wiki-страниц с оглавлением по 93 номерам газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".

6.5. Создание перечня коми поэм и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.

6.6. Пополнение таблицы по комиязычным изданиям книгами за 2022 и 2023 гг.

6.7. Создание ссылок на произведения Степана Семеновича Раевского и Алексея Серафимовича Одинцова, размещенные в коми онлайн библиотеке "Коми гижӧд", со страниц авторов на справочном wiki-ресурсе "Коми тӧданін".

7. Создание мультиязычного корпуса по пермским языкам:

7.1. Предварительное выравнивание в программе WinMerge первоначального текстового материала для мультиязычного параллельного корпуса на русском и пермских языках.

7.2. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии) удмуртских переводов учебников: "М. И. Ильин. Палʼёсыз тодон" (1924), "Географи. Одӥг ёзо школаысь куинетӥ арын дышетоно книга" (1933), "География. Нырысетӥ люкетэз. Начальной школалэн куиньметӥ классэзлы учебник" (1940), "А. С. Барков но А. А. Половинкин. Физической география. Неполной средней но средней школалэн 5-тӥ классэзлы учебник" (1940), "Л. Г. Терехова но В. Г. Эрдели. Географи. Одӥг ёзо школаысь ньылетӥ арын дышетоно книга" (1933), "М. Потемкин но П. Терехов. Географи : ӧжыт гожтэт тодӥсьёслы дышетскон книга " (1934), "И. Г. Иванов. География. Дунне люкетъёс но важнейшой странаос (СССР-тэк)" (1941), "В. А. Тетюрев. Естествознание. 1 люкетэз" (1939), "Н. Н. Баранский. СССР-лэн физической географиез" (1940), "С. В. Чефранов. СССР-лэн физической географиез. Районной обзор" (1941), "В. А. Тетюрев. Естествознание. 2 люкетэз : начальной школалы 4 кл. учебник " (1941), "Л. Г. Терехова, В. Г. Эрдели.  География. 2-тӥ люкетэз: начальной школалы ньылетӥ класслы. 7-тӥ изд." (1940), "М. П. Потёмкин но П. Г. Терехов. География. Взрослойёслӧн школаоссылы учебник" (1939), "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) для корпуса удмуртского языка и мультиязычного корпуса.

7.3. Распознавание и вычитка в программе АВВYY FineReader удмуртского текста учебника "Н. Н. Баранский. СССР географи" (1933) для корпуса удмуртского языка и параллельных корпусов.

7.4. Сверка модернизированных текстов учебников "Б. В. Всесвятский. Ботаника" (1933) и  "М. Я. Цузмер. Зоология" (1933) с текстами на старой орфографии.

8. Помощь коллегам в регионах:

8.1. Создание нового сервиса сортировки для региональных языков РФ (http://sort.fu-lab.ru/).

8.2. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате телеграм канала "Языков много — код один".

8.3. Пополнение коми-пермяцкого корпуса текстами, извлеченными из pdf файлов, предоставленных Сектором научно-методической и издательской деятельности ГКБУК «Коми-Пермяцкий этнокультурный центр», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

8.4. Создание бета-версии коми-пермяцкого спеллера на основе hunspell.

8.5. Создание справочного вики-ресурса по удмуртской письменности (http://udmwiki.fu-lab.ru/).

8.6. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1900-1945 гг. для вики-ресурса по удмуртской письменности на основе каталогов РНБ.

8.7. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1946-2017 гг. для вики-ресурса по удмуртской письменности на основе электронного каталога РНБ и списка, предоставленном сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН.

8.8. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблиц удмуртоязычных книжных изданий 1946-1960 гг. на сайте "Удмурт гожъяськет".

8.9. Создание и заполнение на справочном wiki-ресурсе "Удмурт гожъяськет" отдельных страниц по десяти учебникам 1939-41 гг., страницы с современными правилами удмуртского правописания, страницы с полным списком вокабул удмуртского орфографического словаря и страницы с полным списком удмуртских словарей.

8.10. Реконструкция удмуртского вариативного спелл-чеккера hunspell на основе новых подходов к описанию морфологии и пополнение словарной базы удмуртского спеллера лексикой, выявленной в текстах десяти распознанных изданий 1920-30 гг., лексикой, собранной сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН для грамматического парсера, лексикой предоставленной АУ УР «Издательский дом национальной прессы», а также лексикой, выявленной в текстах газеты "Удмурт дунне" за 1997, 1998 и 2002 гг. (по корпусу "Турку-Ижевск") и актуальных публикациях ИА "Удмуртия". 

8.11. Описание состояния и перспектив развития удмуртского спеллера hunspell на wiki-ресурсе wiki.fu-lab.ru.

8.12. Добавление коми-пермяцкого, обновление коми и удмуртского контента в Онлайн сервисе проверки правописания http://webspell.fu-lab.ru/.

8.13. Создание инструкции по включению модуля проверки орфографии регионального языка в магазин расширений браузера Mozilla Firefox.

8.14. Добавление в магазин расширений браузера  Mozilla Firefox коми-пермяцкого, удмуртского, лугово-марийского и горно-марийского модулей проверки орфографии.

8.15. Создание вепсской раскладки клавиатуры.

8.16. Подключение словарей и морфоанализатора к Корпусу марийского языка. Маркировка примеров корпуса по отнесенности к одному из литературных стандартов марийского языка.

9. Пополнение лексической базы FU-Lab:

9.1. Редактирование и размещение материала коми-русского и русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".

9.2. Размещение сокращенной версии коми-пермяцко-русского словаря на сайте "Коми лингвистика".

9.3. Подключение озвучки для коми-русских словарей к сайту "Онлайн-словари FU-Lab".

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.

10.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Иное.

13.1. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.

13.2. Подборка текстов всех коми поэм для анталогии текстов данного жанара по просьбе Союза писателей Республики Коми.

13.3. Подборка текстов автора А. А. Лыюров из корпуса коми языка для юбилейной публикации по просьбе Союза писателей РК.

13.4. Подготовка трех текстов автора С. М. Морозов для публикации в журнале "Войвыв кодзув" по просьбе редакции.

13.5. Обратный перевод сказки "Материнский ковер" на коми-пермяцкий язык по просьбе сектора фольклора ИЯЛИ КНЦ УрО РАН.

13.6. Устранение технических неполадок на сервере FU-Lab.

13.7. Изучение языка программирования Python.

13.8. Создание инструкции по установке коми раскладки на Яндекс-клавиатуре.

13.9. Озвучивание объявлений автоинформатора и  названий автобусных остановок г. Печора на коми и русском языках по заказу администрации муниципального района "Печора", редактирование аудиозаписи в программе Sound Forge и создание аудиофайлов с названиями отдельных остановок и объявлений.

14. Участие в мероприятиях:  

14.1. Участие в мероприятии "Ӧтувъя коми диктант".  

14.2. Участие в социолигвистическом онлайн коллоквиуме МАФУН, посвященном языковому планированию в отношении финно-угорских языков России в первой половине XX века (2023.05.10).

14.3. Выступление на ІІ Всероссийском форуме финно-угорских народов "Этнокультурное многообразие России: современные вызовы и перспективы развития" на тему "Создание параллельного корпуса и датасета для русско-коми машинного переводчика". (г. Саранск, 2023-08-17).

14.4. Выступление на мероприятии IV Круглый стол «Сохранение родных языков в условиях глобализации», проведенном Полномочным представительством Республики Татарстан в Российской Федерации в Татарском культурном центре (г. Москва, 2023-10-20).

14.5. Выступление перед участниками блог-тура "В гостях у носителей языка" (г. Сыктывкар, 2023-10-27).

14.6. Выступление на семинаре "Об использовании информационных и коммуникационных технологий на уроках коми-пермяцкого языка" с докладом "Коми кыв сьӧрті электроннӧй ресурссэз: клавиатура, спелл-чекер, кыв корпус" (г. Кудымкар, 2023-11-28).

14.7. Проведение лекции для студентов третьего курса коми-пермяцко-русского отделения Пермского государственного гуманитарно-педагогического университета на тему "Онлайн ресурсы и электронные разработки по коми языку для Республики Коми и Пермского края" (г. Пермь, 2023-11-30).
 

2023ʼ вося нёльӧд кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:20 19.12.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Выборочный перевод русскоязычных новостных текстов издания "Коммерсант" и информационного агентства "Интерфакс" на коми язык для параллельного корпуса на коми и русском языках.

2.2. Редактирование словника коми-русского словаря для параллельного корпуса.

2.3. Сборка и предварительная обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг.; создание метаразметок к текстам оригинала и выравнивание документов на двух языках по предложениям для параллельного корпуса.

2.4. Сборка русскоязычных текстов оригинала учебника "Родная речь. Книга для чтения во 2 классе" (1954).

2.5. Разбивка по предложениям текстов книжных изданий  "Рӧднӧй сёрни: начальнӧй школаса мӧд  класслы лыддьысян книга" (1956) и "Родная речь. Книга для чтения во 2  классе" (1954), "Ю. Сотник. Кыдзи ме олі ас кежын" (1951) и "Ю. Сотник. Как я был самостоятельным", "А. Голубева. Уржумса детинка" (1951)  и "А. Голубева. Мальчик из Уржума"; первичное выравнивание коми и русских текстов в  программе WinMerge для  параллельного корпуса.

2.6. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer русскоязычных текстов учебников "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958)" и "Виткович Н. Е. География  (1955)", выравнивание данных текстов с коми переводами соответственно 1963 и 1956 года.

2.7. Орфографическая и терминологическая модернизация коми текстов учебников "И. И. Заславский, Т. П. Герасимова. Физическӧй география. Начальнӧй курс (1963)" и  "Виткович Н. Е. География  (1956)" для текстовой базы русско-коми онлайн переводчика и размещения на портале "Коми мутӧдӧм".

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Корректирование коми новостного массива радио "Коми гор" за 2014, 2015, 2016, 2017 и 2018 гг. для корпуса коми языка. 

3.2. Создание метаразметок и обработка комиязычных текстов БОП, содержащих НПА РК за 2021 и 2022 годы для корпуса коми языка.

3.3. Сканирование в программе ABBYY FineReader переводных книжных изданий на коми языке: "Венгр литератураысь 12 медся мича висьт" (2015), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961) , "А. Авдеенко.  Карпатскӧй бипур дорын" (1962), Т. Гончаренко "Овтӧм ді вылын" (1962), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "Ф. В. Плесовский. Комиын овъяс" (1997), "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958)" и создание их электронных копий в формате pdf.

3.4. Распознавание и вычитка в программе ABBYY FineReader текстов книжных изданий "Рӧднӧй сёрни: начальнӧй школаса нёльӧд класслы лыддьысян книга" (1961), "Рӧднӧй сёрни: начальнӧй школаса мӧд класслы лыддьысян книга" (1956), "А.  Авдеенко. Карпатскӧй бипур дорын" (1962), "Т. Гончаренко. Овтӧм ді вылын" (1962), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961),  "Ф. В. Плесовский. Комиын овъяс" (1997),"А. Голубева. Уржумса детинка" (1951), "Виткович Н. Е. География : нач. школаса 4-ӧд кл. учебник" (1956) и "Заславскӧй И. И., Герасимов Т. П. Физическӧй география : начальнӧй курс : семилетньӧй да средньӧй школаса 5-ӧд кл. учебник" (1963), обработка распознанных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).

3.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №№40-51), журналов "Йӧлӧга" (2023. №№9, 10) и "Войвыв кодзув" (2023. №№4-10), а также изданий "Венгр литератураысь 12 медся мича висьт" (2015) и "Венгр литератураысь 50 медся мича кывбур" (2015); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) .

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-09-03, 1925-09-05, 1925-09-08, 1925-09-10,  1925-09-12, 1925-09-15, 1925-09-17, 1925-09-19, 1925-09-22, 1925-09-24, 1925-09-26, 1925-09-29, 1925-10-01, 1925-10-03, 1925-10-04, 1925-10-06, 1925-10-08, 1925-10-10, 1925-10-13 и 1925-10-14; обработка текстов в программе LibreOffice Writer и добавление в молодцовский корпус.
 
5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Пополнение онлайн-библиотеки "Коми гижӧд" новыми произведениями автора Елена Афанасьева.

5.2. Размещение в онлайн библиотеке "Коми гижӧд" текстов 20 номеров газеты "Југыԁ туј" за 1925 г. в переводе на современную графику.

5.3. Добавление в онлай библиотеку переводной пьесы Н. Обрезковой "Гуманитарнӧй класс" по просьбе автора.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Рӧднӧй сёрни (2-ӧд класслы 1956ʼ вося небӧг)", "Рӧднӧй сёрни (4-ӧд класслы 1961ʼ вося небӧг)", "Том пӧра  коллялӧмӧй! (Е. А. Игушевлӧн 2023' вося небӧг)", "Овтӧм ді вылын (Т.И.  Гончаренко, 1962ʼ вося небӧг)", "Кыдзи ме олі ас кежын (Ю. Сотник, 1961ʼ  вося небӧг)", "Карпатскӧй бипур дорын (А. Авдеенко, 1962ʼ вося небӧг)", "Мый тӧда – сійӧс и висьтала (2014ʼ вося небӧг)".

6.2. Создание и заполнение wiki-страниц с оглавлением по 20 номерам  газеты "Југыԁ туј" за 1925 г.

7. Помощь коллегам в регионах:

7.1. Создание нового сервиса сортировки для региональных языков РФ http://sort.fu-lab.ru/.

7.2. Пополнение коми-пермяцкого корпуса текстами, извлеченными из pdf файлов, предоставленных Сектором научно-методической и издательской деятельности ГКБУК «Коми-Пермяцкий этнокультурный центр», а также комиязычными текстами коми-пермяцких групп социальной сети ВКонтакте за текущий год.

7.3. Размещение сокращенной версии коми-пермяцко-русского словаря на сайте "Коми лингвистика".

7.4. Создание бета-версии коми-пермяцкого спеллера на основе hunspell.

7.5. Реконструкция удмуртского спелл-чекера: устранены отдельные индексы причастий и деепричастий, материал распределен между глагольными формами и отглагольными прилагательными и наречиями, выявлены дополнительные парадигмы спряжения, добавлены парадигмы аббревиатур, перестроена индексация.

7.6. Описание состояния и перспектив развития удмуртского спеллера hunspell на wiki-ресурсе wiki.fu-lab.ru.

7.7. Добавление коми-пермяцкого, обновление коми и удмуртского контента в Онлайн сервисе проверки правописания http://webspell.fu-lab.ru/.

7.8. Создание инструкции по включению модуля проверки орфографии регионального языка в магазин расширений браузера Mozilla Firefox.

7.9. Добавление в магазин расширений браузера  Mozilla Firefox коми-пермяцкого, удмуртского, лугово-марийского и горно-марийского модулей проверки орфографии.

7.10. Создание погодовых таблиц по книжным изданиям на удмуртском языке за 1946-2017 гг. для вики-ресурса по удмуртской письменности на основе электронного каталога РНБ и списка, предоставленном сотрудниками отдела филологических исследований УИИЯЛ УдмФИЦ УрО РАН.

7.11. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблиц удмуртоязычных книжных изданий 1946-1960 гг. на сайте udmwiki.fu-lab.ru.

7.12. Подключение словарей и морфоанализатора к Корпусу марийского языка. Маркировка примеров корпуса по отнесенности к одному из литературных стандартов марийского языка.

7.13. Создание вепсской раскладки клавиатуры.

8. Пополнение лексической базы FU-Lab:

8.1. Подключение озвучки для коми-русских словарей к сайту "Онлайн-словари FU-Lab".

9. Иное:

9.1. Озвучивание объявлений автоинформатора и  названий автобусных остановок г. Печора на коми и русском языках по заказу администрации муниципального района "Печора", редактирование аудиозаписи в программе Sound Forge и создание аудиофайлов с названиями отдельных остановок и объявлений.

9.2. Создание инструкции по установке коми раскладки на Яндекс-клавиатуре.

9.3. Пополнение словарных баз коми, коми-пермяцкого и удмуртского спелл-чеккеров hunspell новой лексикой, выявленной в обрабатываемых текстах.

9.4. Распространение комиязычного контента в соц. сетях.

9.5. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

9.6. Изучение языка программирования Python.

10. Участие в мероприятиях:  

10.1. Выступление на мероприятии IV Круглый стол «Сохранение родных языков в условиях глобализации», проведенном Полномочным представительством Республики Татарстан в Российской Федерации в Татарском культурном центре (г. Москва, 2023-10-20).

10.2. Выступление перед участниками блог-тура "В гостях у носителей языка" (г. Сыктывкар, 2023-10-27).

10.3. Выступление на семинаре "Об использовании информационных и коммуникационных технологий на уроках коми-пермяцкого языка" с докладом "Коми кыв сьӧрті электроннӧй ресурссэз: клавиатура, спелл-чекер, кыв корпус" (г. Кудымкар, 2023-11-28).

10.4. Проведение лекции для студентов третьего курса коми-пермяцко-русского отделения Пермского государственного гуманитарно-педагогического университета на тему "Онлайн ресурсы и электронные разработки по коми языку для Республики Коми и Пермского края" (г. Пермь, 2023-11-30).

2023ʼ ӧшымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 14:03 19.12.2023

27.11.2023–22.12.2023.

  1. Корректирование коми новостного массива радио "Коми гор" за 2014, 2016, 2017 и 2018 гг. для корпуса коми языка. 
  2. Создание метаразметок и обработка текстов БОП, содержащих НПА РК за 2021 и 2022 годы для корпуса коми языка.
  3. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №47-51); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов). 
  4. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов изданий на коми языке:  "А. Голубева. Уржумса детинка" (1951),  "Виткович Н. Е. География : нач. школаса 4-ӧд кл. учебник" (1956) и  "Заславскӧй И. И., Герасимов Т. П. Физическӧй география : начальнӧй курс : семилетньӧй да средньӧй школаса 5-ӧд кл. учебник" (1963).
  5. Добавление текстов, указанных в пп. 1-4, в корпус коми языка.
  6. Создание метаразметок к текстам оригинала и выравнивание текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг. для параллельного корпуса.
  7. Разбивка текста произведения А. Голубевой "Уржумса детинка" ("Мальчик из Уржума") по предложениям и первичное выравнивание в программе WinMerge коми перевода с оригиналом для параллельного корпуса.
  8. Приобретение и сканирование в программе ABBYY FineReader русскоязычного издания учебника "Заславский И. И. Физическая география" (1957).
  9. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer русскоязычных текстов учебников "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958)" и "Виткович Н. Е. География  (1955)", выравнивание данных текстов с коми переводами соответственно 1963 и 1956 года. Загрузка выравненных текстов в параллельный корпус.
  10. Орфографическая и терминологическая модернизация коми текстов учебников "И. И. Заславский, Т. П. Герасимова. Физическӧй география. Начальнӧй курс (1963)" и  "Виткович Н. Е. География  (1956)" для текстовой базы русско-коми онлайн переводчика и размещения на портале "Коми мутӧдӧм".
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-03, 1925-10-04, 1925-10-06, 1925-10-08, 1925-10-10, 1925-10-13 и 1925-10-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Пополнение онлайн-библиотеки "Коми гижӧд" новыми произведениями автора Елена Афанасьева.
  13. Создание ссылок на ресурсы Национальной библиотеки Удмуртской Республики с таблиц удмуртоязычных книжных изданий 1946-1960 гг. на сайте udmwiki.fu-lab.ru.
  14. Создание инструкции по установке коми раскладки на Яндекс-клавиатуре.
  15. Создание инструкции по включению модуля проверки орфографии регионального языка в магазин расширений браузера Mozilla Firefox.
  16. Добавление в магазин расширений браузера  Mozilla Firefox лугово-марийского и горно-марийского модулей проверки орфографии.
  17. Подключение словарей и морфоанализатора к Корпусу марийского языка. Маркировка примеров корпуса по отнесенности к одному из литературных стандартов марийского языка.
  18. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  19. Распространение комиязычного контента в соц. сетях.
  20. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  21. Изучение языка программирования Python.
  22. Выступление на семинаре "Об использовании информационных и коммуникационных технологий на уроках коми-пермяцкого языка" с докладом "Коми кыв сьӧрті электроннӧй ресурссэз: клавиатура, спелл-чекер, кыв корпус" (Кудымкар, 2023-11-28).
  23. Проведение лекции для студентов третьего курса коми-пермяцко-русского отделения Пермского государственного гуманитарно-педагогического университета на тему "Онлайн ресурсы и электронные разработки по коми языку для Республики Коми и Пермского края" (2023-11-30).
FU-Lab. 2023.12.18.-2023.12.22.

опубликовал Öньö Лав в 13:32 19.12.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.12.18.-2023.12.22.

 

  1.  
  2. Продолжение метаразметки и выравнивания текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 г.
  3. Распознавание и вычитка в программе ABBYY FineReader текста книги А. Голубевой "Уржумса детинка" (1951) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer для корпуса коми языка.
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №51); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Загрузка в корпус коми языка вновь обработанных текстов.
  6. Разбивка текста книги А. Голубевой "Уржумса детинка" ("Мальчик из Уржума") на строки и первичное выравнивание в программе WinMerge коми перевода с оригиналом для параллельного корпуса.
  7. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer русскоязычного текста учебника "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс  (1958)" и выравнивание данного текста с коми переводом 1963 года. Загрузка выравненных текстов в параллельный корпус.
  8. Орфографическая и терминологическая модернизация коми текста учебника "И. И. Заславский, Т. П. Герасимова. Физическая география. Начальный курс (1963)" для текстовой базы русско-коми онлайн переводчика и размещения на портале "Коми мутӧдӧм".
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-10-13 и 1925-10-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Подключение словарей и морфоанализатора к Корпусу марийского языка. Маркировка примеров корпуса по отнесенности к одному из литературных стандартов марийского языка.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Изучение языка программирования Python.
FU-Lab. 2023.12.11.-2023.12.15.

опубликовал Öньö Лав в 0:19 15.12.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период  2023.12.11.-2023.12.15.

  1.  
  2. Продолжение метаразметки и выравнивания текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2021 и 2022 гг.
  3. Корректирование коми и русского новостного массива радио "Коми гор" за 2018 гг.  
  4. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №50); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Загрузка в корпус коми языка вновь обработанных текстов.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-10-10 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice Writer русскоязычного текста учебника "Виткович Н. Е. География  (1955)" и выравнивание данного текста с коми переводом 1956 года. Загрузка выравненных текстов в параллельный корпус.
  8. Орфографическая и терминологическая модернизация коми текста учебника "Виткович Н. Е. География  (1956)" для текстовой базы русско-коми онлайн переводчка и размещения на портале "Коми мутӧдӧм".
  9. Приобретение и сканирование русскоязычного издания учебника "Заславский И. И. Физическая география" (1957) для дальнейшего распознавания и выравнивания с коми переводом.
  10. Создание инструкции по установке коми раскладки на Яндекс-клавиатуре.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Изучение языка программирования Python.
Яндекс.Метрика