FU-Lab. 2023.04.24.-2023.04.28.

опубликовал Öньö Лав в 7:09 28.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.24.-2023.04.28.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводного книжных изданий на коми языке и создание их электронных копий в формате pdf: "М. Водопьянов.  Полярнӧй лётчик" (1958), "В. Ардаматский. Ме 11-17" (1963).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader издания "А.  Мусатов. Гӧра йылын керка" (1950), проверка  орфографии, обработка распознанного текста в программе LibreOffice Writer и его первичное выравнивание в программе WinMerge с  русскоязычным квивалентом для параллельного корпуса.
  4. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "Л. Г. Терехова, В. Г. Эрдели. География : учебние для четвертого класса начальной школы" (1938), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года  для параллельного корпуса.
  5. Завершение работы по переводу на русский язык комиязычных фраз и предложений  учебника "Коми язык. 5 класс" (части 1 и 2) и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  6. Продолжение перевода на русский язык  комиязычных фраз и предложений  учебника "Коми язык. 6 класс" (части 1 и 2, 2018 г.) для включения в базу параллельных текстов на коми и русском языках.
  7. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Раевский Степан Семенович. Заключение лицензионного договора с правообладателем.
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Мойдъяс (М. Е.  Салтыков-Щедрин, 1955ʼ вося небӧг)", "Полярнӧй лётчик (М. Водопьянов,  1958ʼ вося небӧг)", "Ме 11-17 (В. Ардаматскӧй, 1963ʼ вося небӧг)";
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-21, 1925-05-23, 1925-05-27, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №15); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ косму тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 15:56 24.04.2023

27.03.2023–24.04.2023.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955), А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
  3. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950),  "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1954), "С. Григорьев. Малахов курган" (1952).
  4. Выравнивание в программе WinMerge коми текстов "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "С. Бабаевский. Му весьтын свет" (1951), с русскими эквивалентами и их включение в базу параллельных текстов на коми и русском языках.
  5. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года, с восполнением лакун по изданию 1936 года.
  6. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках, обработка текстов (разбивка по предложениям, сортировка, устранение повторов) и начало перевода отдельных предложений на русский язык.
  7. Завершение работы по переводу на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  8. Распознавание в программе ABBYY FineReader  и перевод на русский язык коми текста учебников "Коми язык. 5 класс" и "Коми язык. 6 класс" (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  9. Продолжение работы с  текстами новостного массива радио "Коми гор": вычленение русскоязычного новостного массива  за 2018 г.  корректирование русского текста за 2017 год, обработка файла с коми текстом за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы.
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №12-15) и журнала "Йӧлӧга" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-09 (приложение "Комі ԍікт"), 1925-05-12, 1925-05-14 и 1925-05-16 (приложение "Комі ԍікт"), 1925-05-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)", "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)".
  13. Восстановление коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 2023.04.17.-2023.04.21.

опубликовал Öньö Лав в 23:39 20.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.17.-2023.04.21.
     

  1.  
  2. Распознавание и вычитка в программе АВВYY FineReader и обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий "А. Гайдар. Лым крепостьса командир" (1954), "А. Мусатов. Гӧра йылын керка" (1954), "С. Григорьев. Малахов курган" (1952).
  3. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям произведений С. Бабаевского "Зӧлӧтӧй звездаа кавалер. Мӧд книга" (1950), "Му весьтын свет" (1951).
  4. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии) русскоязычного текста учебника "А. С. Барков, А. А. Половинкин. Физическая география" (1937), разбивка на предложения и выравнивание данного текста с коми переводом издания 1939 года и восполнение лакун по изданию 1936 года.
  5. Продолжение перевода на русский язык коми текста учебников "Коми язык. 5 класс"  и "Коми язык. 6 класс"  для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-21, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №15); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.04.10.-2023.04.14.

опубликовал Öньö Лав в 21:14 13.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.10.-2023.04.14.

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Пунченок. Испытание (1953), "П. Журба. Александр Матросов" (1953), "В. Овечкин. Передньӧй крайын" (1954), "А. Мусатов. Гӧра йылын керка" (1955).
  3. Распознавание и вычитка в программе АВВYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка  текстов переводных изданий "М. Белахова. Зэв дона груз" (1954), "А. Гайдар. Нёльӧд блиндаж" (1950). 
  4. Выравнивание в программе WinMerge коми текстов, указанных в п. 3, с русскими эквивалентами и их включение в базу параллельных текстов на коми и русском языках.
  5. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках, обработка текстов (разбивка по предложениям, сортировка, устранение повторов) и начало перевода отдельных предложений на русский язык.
  6. Продолжение перевода на русский язык коми текстов из учебников "Коми язык. 5 класс" для включения в базу параллельных текстов на коми и русском языках.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-05-16 (приложение "Комі ԍікт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №14); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Продолжение восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование различных веток переводчика.
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Испытание (А. Пунченок, 1953ʼ вося небӧг)", "Александр Матросов (П.Г. Журба, 1953ʼ вося небӧг)", "Передньӧй крайын (В. В. Овечкин, 1954ʼ вося небӧг)", "Гӧра йылын керка (А. Мусатов, 1955ʼ вося небӧг)".
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 2023.04.03.–2023.04.07.

опубликовал Öньö Лав в 20:35 06.04.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.04.03.–2023.04.07.

  1.  
  2. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс", части 1 и 2 (2018) для включения в коми корпус и базу параллельных текстов на коми и русском языках.
  3. Перевод на русский язык коми текстов из учебников "Коми язык. 5 класс" для включения в базу параллельных текстов на коми и русском языках.
  4. Продолжение работы с  текстами новостного массива радио "Коми гор": корректирование русского текста за 2017 год, обработка файла с коми текстом за 2019-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за эти годы.
  5. Начало восстановления коми лексики и унификации орфографии в файлах, подготавливаемых для загрузки в нейросеть Sockeye. Тестирование сырой версии переводчика.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №13); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-12 и 1925-05-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  11. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
FU-Lab. 27.03.2023–31.03.2023.

опубликовал Öньö Лав в 21:30 30.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 27.03.2023–31.03.2023.
 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: А. Гайдар "Нёльӧд блиндаж" (1950), А. Гайдар "Лым крепостьса комендант" (1954), М. Белахова "Зэв дона груз" (1954), С. Григорьев "Малахов курган" (1952).
  3. Распознавание в программе ABBYY FineReader коми текста учебника "Коми язык. 6 класс, часть 1" (2018) для включения в базу параллельных текстов на коми и русском языках.
  4. Завершение работы по переводу на русский язык текста учебников коми языка для русскоязычных (1-4 классы), а также  физико-географической части учебного пособия "География Коми АССР" и выравнивание коми и русских эквивалентов в программе WinMerge для включения в базу параллельных текстов на коми и русском языках.
  5. Вычленение русскоязычного новостного массива радио "Коми гор" за 2018 г. 
  6. Продолжение обработки общего файла с коми текстом новостного массива радио "Коми гор" за 2014-2020 гг. на предмет восстановления коми графики и выравнивание коми и русского материала по метаразметкам за 2014-2018 гг.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №12) и журнала "Йӧлӧга" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-09 (приложение "Коми сикт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Нёльӧд блиндаж (А. Гайдар, 1950ʼ вося небӧг)", "Лым крепостьса комендант (А. Гайдар, 1954ʼ вося небӧг)", "Зэв дона груз (М. А. Белахова, 1954ʼ вося небӧг)", "Малахов курган (С. Григорьев, 1952ʼ вося небӧг)".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
2023ʼ вося медводдза квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:03 23.03.2023

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940),  "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
2.2. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
2.3. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
2.4. Перевод с русского языка на коми язык стабильных текстов официальных сайтов администрации и совета МОГО "Сыктывкар" и     выравнивание коми и русских эквивалентов по предложениям в программе WinMerge.
2.5. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы).    
2.6. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.    
2.7. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
2.8. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.
2.9. Локализация интерфейса desktop приложения менеджера Telegram на коми язык и начало локализации iOs и Android приложений менеджера Telegram.
2.10. Предварительная работа по локализации интерфейса браузера Mozilla FireFox на коми язык.
2.11. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    
2.12. Изучение модели нейросети Sockeye для создания автоматического переводчика.

  • Объем параллельного корпуса на 2023-03-28 составляет 1 215 882 выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:
     
3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954), С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
3.2. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводных изданий: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948),   "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959), "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52; 2023. №№-11) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №№1, 2);  обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.4. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в минувшем году в обработанных текстах.

  • Объём корпуса коми языка на 2023-03-28 составляет 77975391 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 30 номеров газеты "Југыԁ туј" (1925-02-14,  1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07), их обработка в программе LibreOffice Writer и включение в молодцовский корпус.

  • Объём молодцовского корпуса на 2023-03-28 составляет 2451193 словоупотреблений.

    
5. Пополнение онлайн библиотеки "Коми гижӧд":
    
5.1. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений авторов Касеева Клавдия Андреевна и Габов Прокопий Валентиновий. Заключение лицензионных договоров с авторами.
5.2. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна.
5.3. Размещение в коми онлайн библиотеке «Коми гижӧд» аудиоматериала к текстам произведений Г. И. Попова.
5.4. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 30 номеров газеты "Југыԁ туј" в переводе на современную графику.
5.5. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000 для коми онлайн библиотеки.

  • Количество текстов в библиотеке возрасло на 746 и на 2023-03-28 составляет 14799 единиц.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание авторской wiki-страницы и библиографии текстов авторов Габов П. В и Касеева К. А., размещение ссылок на произведения, размещенные в библиотеке "Коми гижӧд".
6.2. Пополнение библиографии текстов автора Карманова К. И. на wiki-странице автора, добавление ссылок на новые произведения, размещенные в библиотеке "Коми гижӧд".
6.3. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)", "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)", "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)".
6.4. Создание и заполнение wiki-страниц с оглавлением по 30 номеров газеты "Југыԁ туј" за 1925 год в онлайн-справочнике "Коми тӧданін".
6.5. Создание перечня коми поэм и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
6.6. Пополнение таблицы по комиязычным изданиям книгами за 2022 год.

7. Помощь коллегам в регионах:

7.1. Расппространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации в чате "Языков много — код один".

8. Пополнение лексической базы FU-Lab:
 
8.1. Редактирование и размещение материала коми-русского и русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
9.2. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.  

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Иное.

12.1. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.  
12.2. Подборка текстов всех коми поэм для анталогии текстов данного жанара по просьбе Союза писателей Республики Коми.

13. Участие в мероприятиях:  
 Участие в мероприятии "Ӧтувъя коми диктант".  

2023ʼ рака тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 21:53 22.03.2023

27.02.2023–24.03.2023.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948), М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
  3. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), "Го Можо. Рассказъяс" (1954), "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычным эквивалентом: "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957), М. Горький "Америка йылысь" (1954), "А. Рыбаков. Кортик" (1954).
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)".
  6. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
  7. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы).    
  8. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.    
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), 1925-04-21, 1925-04-23, 1925-04-24, 1925-04-25 (приложение "Коми сикт"), 1925-04-28, 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №7-11) и журнала "Йӧлӧга" (2023 №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).      
  11. Изучение модели нейросети Sockeye для создания автоматического переводчика.
  12. Перевод и редактирование интерфейса финансового раздела калькулятора MATE.    
  13. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.  
  14. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  15. Создание перечня коми баллад и подборка текстов коми поэм для Союза писателей Республики Коми и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
  16. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  17. Распространение комиязычного контента в соц. сетях.
  18. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  19. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  20. Участие в мероприятии "Ӧтувъя коми диктант".   
FU-Lab. 2023.03.20 – 2023.03.24

опубликовал Öньö Лав в 21:51 22.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.20 – 2023.03.24.

 

  1.  
  2. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычным эквивалентом:  М. Горький "Америка йылысь" (1954), А. Рыбаков "Кортик" (1954).
  3. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса (1-4 классы), выделение коми текста, разбивка на предложения, сортировка, выправление предложений, перевод. 
  4. Разделение коми и русского новостного массива радио "Коми гор" за 2015 и 2016 гг. Создание общего файла с коми текстом за 2014-2020 гг. и начало его обработки на предмет восстановления коми графики.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №11); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-05-01 (приложение "Коми сикт"), 1925-05-03, 1925-05-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7. Сбор текстов всех имеющихся коми поэм для Союза писателей Республики Коми.
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.03.13 – 2023.03.17

опубликовал Öньö Лав в 10:57 17.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.13 – 2023.03.17.

  1.  
  2. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954),  А. Рыбаков "Кортик" (1954), проверка орфографии, обработка распознанного текста в программе LibreOffice Writer.
  3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-04-25 (Коми сикт) и 1925-04-28, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №9, №10); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Начало работы по переводу на русский язык текстов учебников коми языка для русскоязычных для параллельного корпуса.
  6. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.
  7. Создание перечня коми поэм для Союза писателей Республики Коми и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному жанру.
  8. Редактирование интерфейса финансового раздела калькулятора MATE.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Распространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 

FU-Lab. 2023.03.06 – 2023.03.10

опубликовал Öньö Лав в 20:09 09.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.03.06 – 2023.03.10.

 

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: М. Горький "Америка йылысь" (1954), Л. Жариков "Суровӧй друг йылысь повесть" (1953), Е. Юнга "Бессмертнӧй корабль" (1953).
  3. Распознавание и вычитка в программе АВВYY FineReader текстов переводных изданий "С. Крушинский. Алтайский хлеб" (1984), "М. Горький. Америка йылысь" (1954), "Изюмскӧй Б. В.  Алӧй погонъяс. Ч. 3 : Дружба ёнмӧ водзӧ" (1957).
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Дзоля принс (А. Сент-Экзюпери, 2022' вося небӧг)", "Аля-каля (А. Шомысовалӧн 2022' вося небӧг)", "Америка йылысь (М. Горькӧй, 1954ʼ вося небӧг)", "Бессмертнӧй корабль (Е. Юнга, 1953ʼ вося небӧг)", "Суровӧй друг йылысь повесть (Л. Жариков, 1953ʼ вося небӧг)", "Кортик (А. Н. Рыбаков, 1954ʼ вося небӧг)";
  5. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика" (продолжение).
  6. Перевод интерфейса финансового раздела калькулятора MATE.
  7. Внедрение поддержки коми правописания в среду операционной системы Simply Linux.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за  1925-04-21, 1925-04-23, 1925-04-24, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.27 – 2023.03.03

опубликовал Инна в 4:30 03.03.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.27 – 2023.03.03.
     

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: С. Крушинский "Алтайскӧй нянь" (1948), А. Бек "Волоколамскӧй шоссе" (1948), А. Новиков-Прибой "Цусима: мӧд часть" (1948);
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "Б. Изюмский. Алӧй погонъяс. Зрелость" (1956), Го Можо "Рассказъяс" (1954).
  4. Первичное выравнивание в программе WinMerge коми текста переводного издания с русскоязычным эквивалентом: "Б. Изюмский. Алӧй погонъяс. Зрелость"_1956.
  5. Редактирование и размещение материала русско-коми словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  6. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №7-8) и журнала "Йӧлӧга" (2023 №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Продолжение перевода текста учебного пособия "География Коми АССР" для портала "Коми мутӧдӧм" и параллельного корпуса.
  8. Изучение модели нейросети Sockeye для создания автоматического переводчика.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-04-07, 1925-04-09, 1925-04-11, 1925-04-12, 1925-04-14, 1925-04-17 (приложение "Коми сикт"), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Расппространение опыта лаборатории FU-Lab по сбору и лингвистической предобработке данных среди языковых активистов других национальных регионов Российской Федерации.
  14.  Участие в мероприятии "Ӧтувъя коми диктант".
FU-Lab. 2023.02.20 – 2023.02.22

опубликовал Öньö Лав в 11:47 22.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.20 – 2023.02.22.

  1.  
  2. Продолжение выравнивания в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Б. Изюмский. Алӧй погонъяс"_1955.
  3. Распознавание и вычитка в программе ABBYY FineReader текста переводного издания: "Б. Изюмский. Алӧй погонъяс. Зрелость"_1956.
  4. Редактирование и размещение материала коми-русского словаря Н. Рогова (1869 г.) на сайте "Коми лингвистика".
  5. Презентация ресурса "Коми мутӧдӧм" участникам мероприятия "Географический диктант Республики Коми". (18.02.2023)
  6. Подготовка презентации и выступление по теме "Деятельность FU-Lab в 2021-2022 гг." в рамках ежегодного отчета-презентации деятельности ЦИЯТ. (21.02.2023)
  7. Запись интервью для телевизионной программы "Вочакыв" КРТК "Юрган". (21.02.2023)
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ урасьӧмся отчётӧ FU-Lab-лӧн пай

опубликовал Инна в 1:03 21.02.2023

2023.01.25 - 2023.02.22

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "А. Гончар. Знаменосецъяс" (1955), , Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956), А. Сент-Экзюпери "Ичӧтик принц" (2021), Го Можо "Рассказъяс" (1954).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводных изданий: "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950), "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959).
  4. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке: "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" , А. Гончар. Знаменосецъяс" (1955), "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)".
  6. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955), "Л. Н. Толстой. Казакъяс" (1956), "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959).
  7. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000.
  8. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.
  9. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
  10. Перевод названий разделов сайта администрации МР "Прилузский" на коми язык.
  11. Перевод с русского языка на коми язык стабильных текстов официального сайта Совета Сыктывкара для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  12. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна. Пополнение библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  13. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов статей П. В. Габова. Создание авторской страницы и библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  14. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №3-6) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  15. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, 1925-03-12, 1925-03-21, 1925-03-27, 1925-03-31, 1925-04-02 и 1925-04-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  16. Локализация интерфейса desktop приложения менеджера Telegram на коми язык. и начало локализации iOs и Android приложений менеджера Telegram.
  17. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
  18. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  19. Продолжение работы по локализации интерфейса браузера Mozilla FireFox на коми язык.
  20. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  21. Распространение комиязычного контента в соц. сетях.
  22. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.13 – 2023.02.17

опубликовал Öньö Лав в 21:20 16.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.13 – 2023.02.17.

  1.  
  2. Сканирование в программе ABBYY FineReader переводного книжного издания на коми языке и создание его электронной копии в формате pdf: Го Можо "Рассказъяс" (1954).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Б. Изюмский. Алӧй погонъяс" (1955), "С. Бабаевский. Зӧлӧтӧй звездаа кавалер" (1950).
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Р. С. Торбан. Лым морт" (1959), "Б. Изюмский. Алӧй погонъяс" (1955).
  5. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Рассказъяс (Го Можо, 1954ʼ вося небӧг)", "Алтайскӧй нянь (С. Крушинскӧй, 1948ʼ вося небӧг)", "Волоколамскӧй шоссе (А. Бек, 1948ʼ вося небӧг)", "Цусима (А. С. Новиков-Прибой, 1948ʼ вося небӧг)";
  6. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2023. №6) и журнала "Йӧлӧга" (2022. №№10, 11, 12, 2023 №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  7. Перевод названий разделов сайта администрации МР "Прилузский" на коми язык.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-31, 1925-04-02 и 1925-04-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Продолжение локализации на коми язык интерфейса desctop приложения и начало локализации iOs и Android приложений менеджера Telegram.
  10. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.02.06 – 2023.02.10

опубликовал Инна в 0:48 10.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.02.06 – 2023.02.10.

  1.  
  2. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956).
  3. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Л. Н. Толстой. Казакъяс" (1956), "Р. С. Торбан. Лым морт" (1959).
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Л. Н. Толстой. Казакъяс" (1956), "Е. Пермяк. Вӧсни струна" (1959), А. Сент-Экзюпери "Ичӧтик принц" (2022).
  5. Выравнивание по предложениям текста произведения А. Сент-Экзюпери "Ичӧтик принц" на французском и русском языках с обоими коми переводами.
  6.  Выравнивание текстов новостной ленты официального портала РК на коми и русском языках за сентябрь 2022 г. - январь 2023 г.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке:  "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)".
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-21 и 1925-03-27, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Локализация интерфейса desktop приложения менеджера Telegram на коми язык.
  12. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.01.30 – 2023.02.03

опубликовал Öньö Лав в 18:36 02.02.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.01.30 – 2023.02.03.

 

  1. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: А. Сент-Экзюпери "Ичӧтик принц" (2021), Б. Изюмский "Алӧй погонъяс" (1955), Б. Изюмский "Алӧй погонъяс" (1956).
  2. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания: "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021).
  3. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Эм. Казакевич. Одер вылын тулыс" (1952), "Антуан де Сент-Экзюпери. Ичӧтик принц" (2021), "Е. Пермяк. Вӧсни струна" (1959), а также коми перевода стабильных текстов официального сайта администрации Совета Сыктывкара с русскоязычным оригиналом.
  4. Вычитка и корректировка текстов произведений С. С. Раевского по изданиям: "Шоныд войвыв"_1988, "Пемӧсъяс йылысь сёрни-басни"_1991, "Нимлун кежлӧ козин"_1995, "Курыд паметь"_2000.
  5. Сборка текстов новостной ленты официального портала РК за сентябрь 2022 г. - январь 2023 г.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Пополнение таблицы по комиязычным изданиям книгами за 2022 год на справочном wiki-ресурсе "Коми тӧданін".
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданяс на коми языке: "Алӧй погонъяс (Б. Изюмскӧй, 1955ʼ вося небӧг)", "Алӧй погонъяс. Зрелость (Б. Изюмскӧй, 1956ʼ вося небӧг)", "Алӧй погонъяс. Дружба ёнмӧ водзӧ (Б. Изюмскӧй, 1957ʼ вося небӧг)" 
  9. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов статей П. В. Габова. Создание авторской страницы и библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-03-12, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Возобновление перевода интерфейса MediaWiki с помощью инструмента перевода translate.wiki.
  12. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.01.23 – 2023.01.27

опубликовал Öньö Лав в 18:44 26.01.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.01.23 – 2023.01.27.

  1.  
  2. Перевод с русского языка на коми язык стабильных текстов официального сайта Совета Сыктывкара для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  3. Сканирование в программе ABBYY FineReader переводного книжного издания и создание его электронной копии в формате pdf: "А. Гончар. Знаменосецъяс" (1955), создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по данному изданию.
  4. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "Эм. Казакевич. Одер вылын тулыс" (1952), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Е. Пермяк. Вӧсни струна" (1959).
  5. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданию "Р. Фраерман. Майскӧй войӧ подвиг" (1948), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959).
  6. Размещение в коми онлайн библиотеке «Коми гижӧд» новых текстов произведений автора Карманова Ксения Ивановна. Пополнение библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-17, 1925-02-19, 1925-02-21, 1925-02-24, 1925-02-27, 1925-03-03, 1925-03-05, 1925-03-07, 1925-03-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Продолжение работы по локализации на коми язык социальной сети ВКонтакте: перевод новых актуальных элементов интерфейса и унификация в других разделах.
  10. Продолжение работы по локализации интерфейса браузера Mozilla FireFox на коми язык.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2023ʼ тӧвшӧрся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 12:59 24.01.2023

2022.12.26 - 2023.01.24

  1.  
  2. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.
  3. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  4. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Э. Казакевич. Одер вылын тулыс" (1952), "Л. Н. Толстой. Казакъяс" (1955), "Е. Пермяк. Вӧсни струна" (1959), "Р. Торбан. Лым морт" (1959), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), "Р. Фраерман. Майскӧй войӧ подвиг" (1948).
  5. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940), "Р. Фраерман. Майскӧй войӧ подвиг" (1948), "Эм. Казакевич. Одер вылын тулыс" (1952), "Р. Фраерман. Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959).
  6. Первичное выравнивание в программе WinMerge переводных коми текстов с русскоязычными оригиналами: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940).
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по переводчикам и переводным изданиям: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)",  "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)",  "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)".
  8. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №52; 2023. №№1, 2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Касеева Клавдия Андреевна. Заключение лицензионного договора с автором. Создание библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  11. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений Г. И. Попова.
  12. Работа по локализации интерфейса браузера Mozilla FireFox на коми язык.
  13. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в минувшем году в обработанных текстах.
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.01.16 – 2023.01.20

опубликовал Öньö Лав в 21:05 19.01.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.01.16 – 2023.01.20.

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  3. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: Е. Пермяк "Вӧсни струна" (1959), Р. Торбан "Лым морт" (1959), Р. Фраерман "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть" (1959), Р. Фраерман "Майскӧй войӧ подвиг" (1948)
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Дикӧй пон Динго либӧ медводдза любовь йылысь повесть (Р. И. Фраерман, 1957ʼ вося небӧг)", "Майскӧй войӧ подвиг (Р. Фраерман, 1948ʼ вося небӧг)", "Лым морт (Р. С. Торбан, 1959ʼ вося небӧг)"
  5. Распознавание и вычитка в программе ABBYY FineReader текста книги Р. Фраерман. "Майскӧй войӧ подвиг" (1948) на коми языке, проверка орфографии, обработка распознанного текста в программе LibreOffice Writer
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Возобновление работы по локализации на коми язык социальной сети ВКонтакте: перевод основных элементов раздела "Звонки" и новых актуальных элементов интерфейса в других разделах.
  8. Продолжение работы по локализации интерфейса браузера Mozilla FireFox на коми язык.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2023.01.09 – 2023.01.13.

опубликовал Öньö Лав в 21:39 12.01.2023

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2023.01.09 – 2023.01.13.

 

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов; выравнивание переводов в программе WinMerge с русским оригиналом.
  3. Сканирование в программе ABBYY FineReader переводного книжного издания и создание его электронной копии в формате pdf: "Л. Н. Толстой. Казакъяс" (1955).
  4. Распознавание и вычитка в программе ABBYY FineReader текста переводного издания: "Эм. Казакевич. Одер вылын тулыс" (1952).
  5. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Н. Дубов. Сирӧта" (1957), "С. Григорьева. Суворов" (1953).
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Вӧсни струна (Е. Пермяк, 1959ʼ вося небӧг)", "Казакъяс (Л. Н. Толстой, 1956ʼ вося небӧг)", "Одер вылын тулыс (Э. Казакевич, 1952ʼ вося небӧг)".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №1); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Размещение в коми онлайн библиотеке «Коми гижӧд» текстов произведений автора Касеева Клавдия Андреевна. Заключение лицензионного договора с автором. Создание библиографии текстов автора на wiki-ресурсе "Коми тӧданін".
  9. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений Г. И. Попова.
  10. Работа по локализации интерфейса Mozilla FireFox.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.12.26 – 2022.12.30

опубликовал Öньö Лав в 18:30 29.12.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.12.26 – 2022.12.30.

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводного книжного издания и создание его электронной копии в формате pdf:  "Э. Казакевич. Одер вылын тулыс" (1952).
  4. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "М. Горький. Рассказъяс" (1954), "Н. Дубов. Сирӧта" (1957), "С. Григрьев. Суворов" (1953), "Э. Гофман. Щелкунчик да шыръяслӧн король" (1940).
  5. Первичное выравнивание в программе WinMerge переводных коми текстов, указанных в предыдущем пункте с русскоязычными оригиналами.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№52); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-14, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц: "Елькина Нина Андреевна", "Шадрин Фёдор Вонифатьевич", "Фантазёръяс (Н. Носов, 1959ʼ вося небӧг)".
  9. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ вося отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 21:44 22.12.2022

=================3. Создание новых продуктов - 3 (в процессе):

1.  Создание онлайн сервиса корпуса параллельных текстов.

1.1. Разработка структуры онлайн сервиса корпуса параллельных текстов на русском и коми языках и создание первой версии параллельного корпуса.
1.2. Создание онлайн сервиса для стандартизации, максимальной парцелляции и финальной обработки параллельных текстов перед загрузкой в базу нейросети.
1.3. Внесение изменений в список исключений и добавление условий в программу разбивки параллельных текстов на предложения.
1.4. Оптимизация структуры таблицы выравненных и готовых к выравниванию текстов на вспомогательном wiki-сайте лаборатории.

2. Создание текстовой базы корпуса параллельных текстов

2.1. Пополнение параллельного корпуса официальных текстов.
2.1.1. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-2001) для корпуса параллельных текстов. Создание метаразметок к текстам документов; разбивка коми и русских текстов на предложения и выравнивание русских оригиналов с коми переводом в программе WinMerge.
2.1.2. Повторное выравнивание по предложениям в программе WinMerge после автоматической разбивки в новом парсере параллельных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2017, 2018, 2019, 2020 гг.
2.1.3. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2021 – сентябрь 2022 года; выравнивание коми и русского эквивалента в программе WinMerge. 
2.1.4. Разбивка на предложения коми и русских текстов новостной ленты Официального портала Республики Коми с марта 2001 по сентябрь 2022 г.,  повторное выравнивание оригиналов и переводов в программе WinMerge.
2.2. Пополнение параллельного корпуса художественных текстов.
2.2.1. Создание общих файлов tran_ru.txt и tran_kv.txt по собранным в 2021 году параллельным текстам художественной литературы на коми и русском языках, выравнивание строк в текстах указанных файлов в программе WinMerge. (84667 строк).
2.2.2. Создание файлов nt_ru.txt  и nt_kv.txt c текстами Нового завета на коми и русском языках (предварительное устранение нумерации, несовпадающих заголовков и т. п., унификация формата в программе gedit), выравнивание текстов на двух языках в программе WinMerge. (9014 строк).
2.2.3. Поиск и сбор для параллельного корпуса дополнительных оригиналов крупных художественных произведений, имеющих перевод на коми язык.
2.2.4. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Дж. Лондон. Мексиканец" (1938), "Н. В. Гоголь Старосветскӧй помещикъяс" (1939), "М. Горький. Челядьдыр" (1939), "Вашингтон Ирвинг. Рип Ван Винкль" (1939), "Марк Твен. Чеччалысь лягуша" (1939), "М. Е. Салтыков-Щедрин. Бӧрйӧм гижӧдъяс" (1939), "Л. Н. Толстой. Хаджи Мурат" (1939), "В. Катаев. Дӧлалӧ ӧтка еджыд парус" (1940), "Л. Савельев. Зимний штурмуйтӧм" (1940), "М. Горький. Йӧзын" (1940), "А. С. Новиков-Прибой. Цусима" (1940), "Книга бӧрся книга. І" (1940), "С. Степняк-Кравчинскӧй. Андрей Кожухов" (1940), "Ванда Василевская. Радуга" (1944), "Б. Горбатов. Покоритчытӧмъяс" (1945), "К. Станюкович. Морскӧй висьтъяс" (1947), "Л. Воронцова. Карса нывка" (1947), "К. Маркс, Ф. Энгельс. Коммунистическӧй партиялӧн манифест" (1948), "М. Горький. Менам университетъяс" (1948), "Л. Кассиль. Менам дона детинкаяс" (1948), "А. Мусатов. Стожары" (1950), "И. Ликстанов. Малышок" (1950), "И. Василенко. Звёздочка" (1950), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), "Е. Кошевая. Пи йылысь повесть" (1951), "Ф. Вигдорова. Менам класс" (1951) , "Елена Ильина. Нёльӧд высота" (1951) , "А. П. Чехов. Каштанка" (1951), "Б. Полевой. Настоящӧй морт йылысь повесть" (1951), "К. Д. Ушинскӧй. Висьтъяс да мойдъяс" (1952), "И. Карнаухова. Дружнӧйяс йылысь повесть" (1952), "Г. Николаева. Вундандыр" (1952), "Максим Горький. Висьтъяс" (1952), "Б. Житков. Кыдзи бать менӧ спасайтіс" (1952), "Вера Панова. Яснӧй берег" (1952), "Н. В. Гоголь. Повесть сы йылысь, кыдзи Иван Иванович пиньӧ воис Иван Никифоровичкӧд" (1952) , "Л. Космодемьянская. Зоя да Шура йылысь повесть" (1952), "М. Прилежаева. Ёртъясыд тэкӧд" (1952), "Чуковскӧй К. И. Доктор Айболит" (1952), "М. Горький. Дед Архип и Лёнька" (1953), "А. Фадеев. Молодая гвардия" (1953), "Л. Н. Толстой. Кавказскӧй пленник" (1953) , "М. Лермонтов. Миян кадся герой" (1953) , "Сергей Розанов. Травкалӧн приключениеяс" (1953) , "В. Осеева. Васёк Трубачёв да сылӧн ёртъясыс. Коймӧд книга" (1953), "Н. Бирюков. Чайка" (1953), "Н. Никитин. Войвывса Аврора" (1953), "Д. Н. Мамин-Сибиряк. Висьтъяс" (1953), "Георгиевская С. М. Бабушкалӧн море" (1953), "Н. Носов. Витя Малеев школаын да гортас" (1953), "В. Короленко. Синтӧм музыкант" (1953), "Юлиус Фучик. Казнь водзвылын кыв" (1953), "А. С. Серафимович. Рассказъяс" (1954), "Ю. Сотник. Аддзывлытӧм лэбач" (1954), "Иосиф Дик. Би шор" (1954), "Г. И. Успенский. Растеряевӧй улича вылын оланног" (1954), "А. П. Чехов. Рассказъяс" (1954), "А. Батров. Миян друг Хосе" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. С. Лесков. Рассказъяс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Воронкова Л. Алтайскӧй повесть" (1954), "Иван Франко. Рассказъяс" (1954), "А. Кононов. Сокольникиын ёлка" (1954), "Н. Дубов. Му помасянінын" (1954), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "В. Баныкин. Тулысын ытва дырйи" (1955), "А. Кононов. Вернӧй сьӧлӧм" (1955), "П. Кальма. Горчичнӧй райысь челядь" (1955), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Вадим Собко. Мирлӧн залог" (1955), "С. Антонов. «Веж луг»" (1955 ), "Н. Островский. Кыдзи калитчис сталь" (1955), "С. Диковскӧй. «Смелӧй» катерлӧн приключениеяс" (1956), "Короленко В. Г. Кыв тӧдтӧг" (1956), "А. П. Чехов. Канитель да мукӧд рассказъяс" (1956), "Л. Воронцова. Беспокойнӧй морт" (1956), "Н. Шундик. Ылі войвылын" (1956), "В. Кочетов. Журбинъяс" (1956), "М. Горький. Мам" (1957), "Э. Войнич. Овод" (1957), "Л. Н. Толстой. Бӧрйӧм гижӧдъяс" (1957), "В. Дуров. Менам зверьяс" (1958), "Д. Дэфо. Робинзон Крузо..." (1958), "В. Тендряков. Повесть да рассказъяс" (1958), "М. Шолохов. Мортлӧн судьба" (1958), "Михаил Шолохов. Лэптӧм эжа. 1 юкӧн" (1958), "А. Чумаченко. Тӧлысьвывса морт" (1958), "Н. Носов. Ичӧтик гажа семья" (1958), "Джек Лондон. Рассказъяс" (1958), "А. Гайдар. Барабанщиклӧн судьба" (1958), "С. Воронин. Ковтӧм слава" (1958), "М. Коршунов. Черёмушкиын керка" (1959), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "И. Василенко. Рассказъяс" (1959), "В. Бонч-Бруевич. Миян Ильич" (1959), "А. Авдеенко. Тисса дорын" (1959), "А. Авдеенко. Гӧраясын тулыс" (1959), "На пороге юности" (1959), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960), "М. А. Шолохов. Лэптӧм эжа. Мӧд книга" (1961), "Анатолий Мошковский. Веж гыяс" (1961), "Виктор Баныкин. Чапаев йылысь висьтъяс" (1962), "Сергей Баруздин. Выль сикт" (1963), "Л. Воронкова. Звёздочкаса командир" (1963), "Г. Карпенко. Куим звӧнок" (1964), "Виктор Баныкин. Вильыш детинка" (1964), "А. Кононов. Смольнӧйын" (1966), "С. Виноградская. Юбиляр" (1969), "Предпутие. Туйводз 2" (2021); включение данных текстов в параллельный корпус.
2.2.5. Распознавание в программе ABBYY FineReader русскоязчычного текста на старой орфографии издания "Д. Н. Маминъ-Сибирякъ. Дѣдушкино золото" (1912) для выравнивания с коми переводом.
2.2.6. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) коми и русских текстов двуязычного издания "Шӧвк тупыль" (2012); выравнивание в программе WinMerge коми оригинала с русским переводом и включение текстов в парралельный корус.
2.2.7. Первичное выравнивание в программе WinMerge текстов русских переводов с коми оригиналами изданий "Иван Торопов. Тіянлы водзӧ овны" (1980) и "В. Юхнин. Биа нюр" (1952) для корпуса параллельных текстов.
2.3. Пополнение параллельного корпуса художественных текстов.
2.3.1. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.
2.3.2. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии,  метаразметка) русскоязычных оригиналов изданий "В. А. Тетюрев. Естествознание. 3 класс" (1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1940),  "М. Н. Скаткин. Природоведение. 4 класс"  (1968), "Л. Г. Терехова, В.Г . Эрдели. География. 3 класс" (1938), "Л. Г. Терехова, В. Г. Эрдели. География. 4 класс" (1938), "И. Г. Иванов. География частей света и важнейших стран (без СССР)" (1935), "П. Н. Счастнев, П. Г. Терехов. География частей света: учебник для 6 класса" (1959). Выравнивание коми переводов с русскими оригиналами в программе WinMerge и включение текстов в парралельный корпус.
2.4. Пополнение параллельного корпуса новостных текстов.
2.4.1. Перевод с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. (240991 зн.) и 2019 г. (223948 зн.).
2.4.2. Сборка новостных текстов радио "Коми гор" за 2018, 2019 и 2020 гг. и создание метаразметок к текстам.  Выделение в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.
2.4.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.
2.4.4. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
2.5. Перевод коми текстов на русский язык для корпуса параллельных текстов.
2.5.1. Перевод текстов газеты "Коми му" (2022 №32) с коми языка на русский язык (24476 знаков).
2.6. Объем параллельного корпуса на 22.12.2022 - 1 070 324 выравненных предложений.

3.  Работа по подготовке к локализации сайтов и программ

3.1. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО "Сыктывкар",  Сысольского, Усть-Куломского, Ижемского и Печорского районов.
3.2. Перевод с русского языка на коми язык стабильных текстов сайтов администраций МОГО "Сыктывкар" (183.188), Сысольского (338813 зн.), Ижемского (665.161 зн.), Печорского (39.939 зн.) и Усть-Куломского районов (296.831 зн.) Республики Коми для коми локализации и корпуса параллельных текстов; выравнивание коми перевода  с текстами на языке оригинала в программе WinMerge.
3.3. Работы по локализации приложений операционной системы Simply Linux.
3.4. Перевод на коми язык глоссария данной ОС, предоставленного разработчиком (2139 строк).
3.5. Подготовка Русско-коми словаря лексем, фраз и выражений, используемых при локализации операционных систем, программного обеспечения, браузеров и сайтов.

==============4. Пополнение и модернизация существующих электронных ресурсов - 12, в том числе:

1. Текстовое пополнение и оптимизация Корпуса коми языка:

1.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), книг О. И. Уляшев. "Кад пыр верзьӧмӧн" (2019), О. И. Уляшев. "Зарни бобув" (2021), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), сборника "Вын" (2022), двуязычных изданий "Шӧвк тупыль" (2012), "Туйводз-2" (2021) переводных изданий "Э. Гофман.  Щелкунчик да шыръяслӧн король" (1940), "О. Иваненко.  Тараслӧн доля" (1941), "Л. Воронкова. Карса нывка" (1947), "Кассиль Л. А. Менам дона детинкаяс" (1948), "И. Д. Василенко.  Звездочка" (1950), "Д. Н. Мамин-Сибиряк.  Кыйсьысь Емеля" (1950), "А. Мусатов. Стожары" (1950), "А. Голубева. Уржумысь детинка" (1951), "Гримм вокъяс. Бременса музыкантъяс" (1951), "А. П. Чехов.  Каштанка" (1951), "К. И. Чуковскӧй. Доктор Айболит" (1952), "Гайдар А. П. Ылысса странаяс" (1952), "Г. Николаева. Вундандыр" (1952), "Максим Горький. Архип дед да Лёнька" (1953), "С. М. Георгиевская. Бабушкалӧн море" (1953), "С. Т. Григорьев.  Суворов" (1953), "Н. Бирюков. Чайка" (1953), "В. Г. Короленко. Синтӧм музыкант" (1953), "Н. Н. Носов. Витя Малеев школаын да гортас" (1953), "Н. И. Дубов. Му помасянінын" (1954), "Л. Воронкова. Алтайскӧй повесть" (1954), "Н. В. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. И. Дубов. Ю вылын бияс" (1954), "А. Пушкин. Дубровский" (1954), "Л. Толстой. Рассказъяс" (1954), "Максим Горький. Рассказъяс" (1954), "В. И. Баныкин. Тулысын ытва дырйи" (1955), "Н. Островский. Кыдзи калитчис сталь" (1955), "А. С. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "М. Е. Салтыков-Щедрин. Мойдъяс"  (1955), "Л. Воронкова. Беспокойнӧй морт" (1956), "Б. Емельянов. Мечта"  (1957), "Н. Дубов. Сирӧта" (1957), "М. Марьенков. Дружба" (1958), "С. А. Воронин. Ковтӧм слава" (1958), "Д. Дэфо. Робинзон Крузо..." (1958), "И. Д. Василенко. Рассказъяс" (1959), "А. Г. Алексин. Комын ӧти лун" (1959), "Л. Воронкова. Ичӧтик зарни ключьяс" (1959), "В. Панова. Сережа" (1960), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960), "М.Н. Скаткин. Природоведение. 4 кл." (1962), "Г. М. Кржижановский. Шу-Шу" (1969); обработка сканов в программе  ABBYY FineReader и создание pdf файлов.
1.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).
1.3. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001), текстов журналов "Войвыв кодзув"  (1962 №1) и  "Ударник" (1940 №№1-12), газеты "Колхозный труд" (май-сентябрь 1943 года), книг О. И. Уляшев "Зарни бобув" (2021), Е. А. Игушев.  "Коми кывлӧн стилистика" (2003), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), "Вын" (2022), "Туйводз-2" (2021), ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун", переводных изданий: "Л. Воронцова. Карса нывка" (1947), "Л. Кассиль. Менам дона детинкаяс" (1948), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), "И. Василенко. Звёздочка" (1950), "А. Мусатов. Стожары" (1950), "Н. Носов. Витя Малеев школаын да гортас" (1953) "А. П. Чехов. Каштанка" (1951), "Г. Николаева. Вундандыр" (1952), "Чуковскӧй К. И. Доктор Айболит" (1952), "Георгиевская С. М. Бабушкалӧн море" (1953), "В. Короленко Синтӧм музыкант" (1953), "Н. Бирюков. Чайка" (1953), "М. Горький. Дед Архип и Лёнька" (1953), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "Воронкова Л. Алтайскӧй повесть" (1954), "Н. Дубов. Му помасянінын" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. Островский. Кыдзи калитчис сталь" (1955), "В. Баныкин. Тулысын ытва дырйи" (1955), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Л. Воронцова. Беспокойнӧй морт" (1956), "Д. Дэфо. Робинзон Крузо..." (1958), "С. Воронин. Ковтӧм слава" (1958), "И. Василенко. Рассказъяс" (1959), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "М. Жестева. Ичӧтик трактористлӧн приключениеяс" (1960).
1.4. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) ранее распознанных текстов: К. Королёв. "Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;
1.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№1-51), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№1-7) и "Йӧлӧга" (2021 №12, 2022 №1-6), а также текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
1.6. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
1.7. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) текста издания "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962), текстов номеров газет "Водзӧ" за январь 1946 года и  "Выль Войвыв" за март-декабрь 1956 года.
1.8. Вычитка и корректирование уникальных художественных текстов журнала "Войвыв кодзув" (№№ 7, 8, 11, 12 за 1975 г.),  текстов произведений В. Юхнина, И. И. Пыстина (публицистические, литературоведческие, драматические произведения, переводы), Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988) и "Коми кывйыс гажаджык на биысь" (1998).
1.9. Сравнение и корректирование в программе Meld редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.) пьесы В. Леканова "Сиктса рытъяс" (1954 и 1988 гг.) и произведений И. И. Пыстина, имеющих разные редакции.
1.10. Обработка текстов новостной ленты официальных порталов Республики Коми на коми языке за декабрь 2021 - сентябрь 2022 года (метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell).
1.11. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.
1.12. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.
1.13. Подписка на полный комплект электронных версий газет и журналов ГАУ РК "Издательский дом Коми" на 2023 год.
1.14. Текущие исправления возникающих технических проблем функционирования корпуса.
1.15. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса. Объем корпуса на 22.12.2022 - 76 787 564 словоупотреблений.

2. Текстовое пополнение молодцовского и латинского корпуса:

2.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)  и добавление в молодцовский корпус текстов 77 комиязычных номеров газеты "Југыԁ туј" за 1924-25 гг.
2.2. Сканирование и обработка в программе ABBYY FineReader сканов, создание pdf копий книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
2.3. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, сделанных в Национальной библиотеке Республики Коми.
2.4. Создание фотокопий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. в Национальном архиве Республики Коми.
2.5. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1921).
2.6. Корректура оригинальных текстов изданий "1922. Комі јӧзлы каԉенԁар" (1921), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932) и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932).
2.7. Распознавание и вычитка в программе ABBYY FineReader  текстов на молодцовице изданий "Поԉарнӧј похоԁ Краԍінӧн" (1930) и "Комі облаԍтлы ԁасвіт во" (1936).
2.8. Распознавание и вычитка в программе ABBYY FineReader, корректирование с помощью латинского/молодцовского спеллера в программе LibreOffice Writer текстов на коми латинице из изданий "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и на молодцовице из изданий "Комі каԉенԁар" за 1923 и 1924 гг., "Вотјас" (1923), "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936).
2.9. Перевод на современную графику, вычитка и корректирование в программе LibreOffice Writer текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Важ јӧзлӧн історіја".
2.10. Загрузка в молодцовский (либо латинский) корпус текстов альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг., книжных изданий "Вотјас" (1923), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932)‎‎, "Кӧрым ԍілосујтӧмын отсӧг" (1932)‎‎, "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932)‎‎, "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932)‎‎, "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932), "Fiⱬiçeskəj geografija" (1933), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934), "В. А. Ԏеԏурев. Јесԏествознаԋіје. Первојја чаԍт" (1935),  "В. А. Ԏеԏурев. Јесԏествознаԋіје. Мӧԁ чаԍт (1935)", "Л. Г. Ԏерехова ԁа В. Г. Ерԁеԉі.  Географіја. Первојја чаԍԏ. Начаԉнӧј школаса којмӧԁ класслы учебԋік (1936)", "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "Г. І. Іванов. Географіја свет јукӧнјаслӧн ԁа меԁтӧԁчана странајаслӧн (СССР-тӧг)" (1936).
2.11. Регулярное обновление корпуса. Объем корпуса на 22.12.2022 -  2 384 848 словоупотреблений.

3. Создание и пополнение коми-пермяцкого корпуса

3.1. Создание коми-пермяцкого раздела корпуса коми языка на основе текстов оригинальной художественной литературы (1921-2004 гг.).
3.2. Пополнение коми-пермяцкого корпуса текстами еженедельника "Кама кытшын" за 2019-22 гг.,  комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг., переводов на коми-пермяцкий язык по изданиям 1940-60 гг.,  учебников 1930-40 гг. и готовыми текстами молодцовского и латинского периода на современной графике. Метаразметка текстов.
3.3. Распознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).
3.4. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
3.5. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.
3.6. Сборка, метаразметка, обработка в программе gedit (унификация кавычек, тире и дефисов, замена латинских ӧ и і коми эквивалентами, устранение лишних пробелов) и загрузка в коми-пермяцкий раздел корпуса коми языка текстового контента онлайн-ресурса "Велӧтісь".
3.7. Регулярное обновление корпуса. Объем на 22.12.2022 -  6 196 963 словоупотреблений.

4. Пополнение онлайн библиотеки "Коми гижӧд":

4.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников.
4.2. Размещение в онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961), "Дінъёльса вӧрпункт" (1983), "Герой йылысь сказ" (1945), а также текстов того же автора, опубликованных в журналах "Войвыв кодзув" и "Ударник".
4.3. Обработка текстов произведений и переводов  И. И. Пыстина  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций; выравнивание абзацев, исправление орфографии старых изданий на современную орфографию) и размещение данных текстов в онлайн библиотеке "Коми гижӧд".
4.4. Размещение в онлайн библиотеке текстов произведений Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988), "Коми кывйыс гажаджык на биысь" (1998) и "Коми кывлӧн стилистика" (2003).
4.5. Размещение в онлайн библиотеке текстов 77 комиязычных номеров газеты "Југыԁ туј" за 1924-25 год в переводе на современную графику.
4.6. Перевод на современную графику текстов книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и  "Войвыв край овмӧс йылысь очеркъяс" (1932), а также альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг.; их повторная вычитка и размещение в онлайн библиотеке "Коми гижӧд" параллельно с текстами на оригинальной графике.
4.7. Повторная вычитка на современной графике текстов книжных изданий "Вотјас" (1923), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932),  "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и  их размещение в онлайн библиотеке "Коми гижӧд" параллельно на современной и оригинальной графике.
4.8. Добавление текстов изданий 1932 года на  молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" параллельно к ранее размещенным редакциям на современной графике.
4.8. Размещение в Коми онлайн библиотеке произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
4.10. Размещение в онлайн библиотеке "Коми гижӧд" перевода повести А. де Сент-Экзюпери "Дзоля принц" (вариант Е. Цыпанова) параллельно с текстом оригинала.
4.11. Модернизация коми переводных текстов издания "Книга бӧрся книга. І" (1940) для размещения в онлайн библиотеке "Коми гижӧд".
4.12. Размещение в онлайн библиотеке "Коми гижӧд" текстов рассказа Д. Н. Мамина-Сибиряка "Дедлӧн зарни", сказок "Аладдин да шемӧс лампа", "Али-Баба да нелямын шыш" параллельно на коми и русском языках.
4.13. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
4.14. За отчетный период количество текстов в библиотеке возросло на 2231 единицу и на 22.12.2022 составляет 14053 текста.

5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

5.1. Создание и заполнение информационных wiki-страниц по 64 изданиям: "Дневник Николая Фёдоровича Терентьева" (2021), "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005),  "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), "М. А. Кастрен — Сибир туялысь (2014)"; "М. Н. Скаткин. Природоведение : 4-ӧд класслы учебник" (1962, "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)", "Ӧтисянь дасӧдз (2000ʼ вося небӧг)", "География (гырысьяслы, 1936’ вося небӧг)"‎‎, "Газетнӧй лист: электрическӧй опытъяс (1933ʼ вося небӧг)", "География (4-ӧд класслы, 1939ʼ вося небӧг)", "1922 – сюрс ӧкмыссё кызь кыкӧд во (1922ʼ вося небӧг)", "Коми календар. 1923" и "Коми календар. 1924", "Алтайскӧй повесть (Л. Воронкова, 1954ʼ вося небӧг)", "Архип дед да Лёнька (М. Горькӧй, 1953ʼ вося небӧг)", "Бабушкалӧн море (С. Георгиевская, 1953ʼ вося небӧг)", "Беспокойнӧй морт (Л. Воронкова, 1956ʼ вося небӧг)", "Бременса музыкантъяс (Гримм вокъяс, 1951ʼ вося небӧг)", "Витя Малеев школаын да гортас (Н. Носов, 1953ʼ вося небӧг)", "Вундандыр (Г. Николаева, 1952ʼ вося небӧг)", "Доктор Айболит (К. Чуковскӧй, 1952ʼ вося небӧг)", "Дружба (Марьенков М., 1958ʼ вося небӧг)", "Дубровскӧй (А. С. Пушкин, 1954ʼ вося небӧг)", "Звездочка (Н. Василенко, 1950ʼ вося небӧг)", "Ичӧтик зарни ключьяс (Л. Воронкова, 1959ʼ вося небӧг)", "Ичӧтик трактористлӧн приключениеяс (М. Жестев, 1960ʼ вося небӧг)", "Карса нывка (Л. Воронкова, 1947ʼ вося небӧг), "Каштанка (А. П. Чехов, 1951ʼ вося небӧг)", "Ковтӧм слава (С. Воронин, 1958ʼ вося небӧг)", "Комын ӧти лун (А. Алексин, 1959ʼ вося небӧг)", "Кыдзи калитчис сталь (Н. Островскӧй, 1955ʼ вося небӧг)", "Кыйсьысь Емеля (Д. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Менам дона детинкаяс (Л. Кассиль, 1948ʼ вося небӧг)", "Мечта (Б. Емельянов, 1957ʼ вося небӧг)", "Мореход Робинзон Крузо, сылӧн олӧм да шензьӧдана приключениеяс (Д. Дефо, 1958ʼ вося небӧг)", "Му помасянінын (Н. Дубов, 1954ʼ вося небӧг)", "Повтӧмъяс да кужысьяс йылысь (Н. Богданов, 1954ʼ вося небӧг)", "Покойнӧй Иван Петрович Белкинлӧн повестьяс (А. С. Пушкин, 1955ʼ вося небӧг)", "Предпутие. Туйводз 2 (2021' вося небӧг)", "Рассказъяс (И. Василенко, 1959ʼ вося небӧг)", "Рассказъяс (Л. Толстой, 1954ʼ вося небӧг)", "Рассказъяс (М. Горькӧй, 1954ʼ вося небӧг)", "Сережа (В. Панова, 1960ʼ вося небӧг)", "Синтӧм музыкант (В. Короленко, 1953ʼ вося небӧг)", "Сирӧта (Н. Дубов, 1957ʼ вося небӧг)", "Стожары (А. Мусатов, 1950ʼ вося небӧг)", "Суворов (С. Григорьев, 1953ʼ вося небӧг)", "Тараслӧн доля (О. Иванченко, 1941ʼ вося небӧг)", "Тулысын ытва дырйи (В. Баныкин, 1955ʼ вося небӧг)", "Уржумысь детинка (Голубева А., 1951ʼ вося небӧг)", "Чайка (Н. Бирюков, 1953ʼ вося небӧг)", "Шу-Шу  (Г. Кржижановскӧй, 1969ʼ вося небӧг)", "Щелкунчик да шыръяслӧн король (Э. Гофман, 1940ʼ вося небӧг)", "Ылысса странаяс (А. Гайдар, 1952ʼ вося небӧг)", "Ю вылын бияс (Н. Дубов, 1954ʼ вося небӧг)"; пополнение библиографии на страницах авторов либо переводчиков.
5.2. Создание wiki-страниц с содержанием 77 комиязычных номеров газеты "Југыԁ туј" за 1924-25 год с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
5.3. Создание wiki-страниц по номерам журналов "Ударник" (1940. №1-12), "Войвыв кодзув" (1961. №1; 2021. №10-12; 2022. №№1-7) и издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
5.4. Создание и заполнение отдельных wiki-страниц по произведениям И. И. Пыстина, имеющих разные редакции.
5.5. Добавление ссылок на произведения, размещенные в онлайн-библиотеке "Коми гижӧд", с wiki-страниц авторов Е. А. Игушев, В. Лодыгин и В. Юхнин, А. Шомысова, И. Пыстин.
5.6. Создание и заполнение отдельных wiki-страниц по библиографии переводчиков: "Улитин Николай Андреевич", "Дзюба Татьяна Николаевна".
5.7. Внесение информации о корректуре на wiki-страницы, посвященных обработанным номерам издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. и №№2-12 журнала "Войвыв кодзув" за 1962 год, а также книжных изданий: Фіԅіка. 2-ӧд юкӧн" (1932), "Војвыв крај овмӧс јылыԍ очеркјас" (1932), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932) и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932),  "Важ јӧзлӧн історіја" (1932), "Шӧвк тупыль" (2012), "А. Ԋечајев. Географія : І ст. школаса ІІІ-ӧԁ волы" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и "Вотјас" (1923).
5.8. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
5.9. Пополнение библиографии периодики содержанием номеров газеты «Коми му» (2021 № 39-52, 2022 №1-26) и журнала «Йӧлӧга» (2021  № 9-12, 2022 №1-8).
5.10. Дополнение указателя комиязычных публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г.,  №№1-12 за 2021 гг., №№1, 2 за 2022 гг.
5.11. Создание ссылок со страниц изданий на страницы авторов и наоборот.
5.12. Пополнение погодовых списков книжных изданий, создание ссылок на новые страницы.

6. Пополнение лексической базы FU-Lab:

6.1. Сортировка объединенного списка названий организаций и учреждений, созданного по материалам выполненных заявок БОП за 2012–2021 гг.; обработка общего списка (устранение вновь выявленных повторов, уточнение названий по данным официальных сайтов), создание разметки xml и загрузка "Русско-коми словаря названий организаций и учреждений" (3224 словарные статьи) на сайт Онлайн словари FU-Lab, редактирование онлайн версии словаря, унификация подачи аналогичных случаев.
6.2. Сбор и перевод на коми язык дополнительных названий республиканских и муниципальных учреждений и организаций  Республики Коми, а также названий их отделов и филиалов, не попавших в список, составленный по материалам выполненных заявок БОП за 2012–2021 гг.
6.3. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".
6.4. Выработка предложений для Коми РТОК по отдельным проблемам перевода.
6.5. Работа по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

7. Пополнение образовательного портала "Коми кыв"

7.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).
7.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.
7.3. Создание и обработка (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.
7.4. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.

8. Пополнение лингвистического сайта "Коми кыв"

8.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
8.2. Размещение информационных материалов, освящающих события в секторе языка ИЯЛИ ФИЦ "КНЦ УрО РАН".

9. Пополнение образовательного сайта "Коми география":

9.1. Продолжение перевода текста учебника географии для 7 класса (2012),  редактирование новых разделов и их размещение на сайте "Коми мутӧдӧм".
9.2. Создание модернизированных версий текстов по географии из изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и  "Fiⱬiçeskəj geografija" (1933)  и размещение обновленных текстов на портале "Коми мутӧдӧм".
9.3. Выравнивание в программе WinMerge и сравнение в программе Meld конгруэнтных коми текстов разных изданий учебников по естествознанию для 3-4 классов (1935 и 1940) и географии для 3 класса (1936 и 1939).
9.4. Продолжение перевода с русского языка на коми язык текстов учебного пособия "География Коми АССР" (1987).

10. Пополнение коми аудиокорпуса:

10.1. Добавление в аудиобазу лаборатории файлов с выпусками радиопередачи "Миян кад" за ноябрь-декабрь 2021 г. и аудиофайлов с художественными текстами, предоставленными С. Г. Горчаковой.

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение отчетного периода.
11.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11.3. Обновление лексической базы коми (вариативного) спелера в Онлайн-сервисе проверки орфографии


12. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru
12.1. Добавление сервиса построчного сравнения файлов.
12.2. Добавление сервиса создания tmx-файлов.

13. Помощь коллегам в регионах:

13.1. Создание wiki-пространства с поддоменом selkup.fu-lab.ru для публикации специалистами лингвистических разработок по селькупскому языку.
13.2. Добавление в виртуальную клавиатуру лексикографического ресурса dict.fu-lab.ru специфических символов тувинского алфавита: ң ө ү.

+Распространение комиязычного контента в соц. сетях.

+Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

+Участие в мероприятиях:

• Участие в мероприятии «Ӧтувъя коми диктант» (2022.02.21).
• Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". (Пермь-Кудымкар-Кочево, 17.02.2022) с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.
• Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ, 2022.04.22).
• Участие в  zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
• Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
• Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
• Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК (2022.07.05).
• Участие в мероприятии "Достояние Севера-2022"; в рамках подготовки к мероприятию составлена Google-презентация по продуктам лаборатории FU-Lab (2022.08.27).
• Семинар с магистрантами-регионоведами Сыктывкарского государственного университета им Питирима Сорокина по теме "Основные продукты лаборатории FU-Lab и возможности их использования". (19 октября 2022 г.)
• Выступление с сообщением на тему "Новые онлайн ресурсы для научного изучения коми языка" на XIX Международном симпозиуме "Диалекты и история пермских языков во взаимодействии с другими языками". (21 октября 2022 г.).
• Выступление на сыктывкарской ежегодной конференции коми народа "Комфортная городская среда в городе Сыктывкаре" с сообщением "Локализация муниципальных сайтов на коми язык" (18 ноября 2022 г.).
• Выступление на тему "Продвижение коми языка в электронном информационном пространстве" на международной конференции, организованной в Национальной библиотеке Республики Коми в рамках проведения Арктических Дельфийских игр. (26 ноября 2022 г.).
• Участие в VI форуме «Языковая политика в Российской Федерации», выступление с докладом на тему "Продвижение коми языка в электронное информационное пространство: опыт FU-Lab" (г. Москва, 8-9 декабря 2022 г.).
• Проведение 10 вебинаров в Коми республиканском институте развития образования:
"Порядок установки и особенности функционирования коми раскладкок клавиатуры" (2022.01.27)
"Особенности функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" (2022.03.16).
"Использование образовательного портала "Коми кыв" в процессе обучения коми языку" (2022.03.17).
"Автоматическая проверка правописания в процессе обучения коми языку" (2022.04.15)
"Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022.06.23).
"Дополнительный онлайн-инструментарий в процессе обучения коми языку" (2022.10.14).
"Основные разделы корпуса коми языка, особенности настройки поиска и сортировки при работе с корпусом" (2022.10.18).
"Использование электронного ресурса "Портал для изучающих коми язык "Коми кыв" (2022.11.17).
"Распознавание коми текстов в программе ABBYY FineReader" (2022.12.07).
"Онлайн библиотека "Коми гижӧд" и ее место в электронной инфраструктуре коми языка" (2022.12.14).

2022ʼ нёльӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:13 21.12.2022

 

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.

2.2. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Дж. Лондон. Мексиканец" (1938), "Н. В. Гоголь Старосветскӧй помещикъяс" (1939), "М. Горький. Челядьдыр" (1939), "Вашингтон Ирвинг. Рип Ван Винкль" (1939), "Марк Твен. Чеччалысь лягуша" (1939), "М. Е. Салтыков-Щедрин. Бӧрйӧм гижӧдъяс" (1939), "Л. Н. Толстой. Хаджи Мурат" (1939), "В. Катаев. Дӧлалӧ ӧтка еджыд парус" (1940), "Л. Савельев. Зимний штурмуйтӧм" (1940), "М. Горький. Йӧзын" (1940), "А. С. Новиков-Прибой. Цусима" (1940), "Книга бӧрся книга. І" (1940), "С. Степняк-Кравчинскӧй. Андрей Кожухов" (1940), "Ванда Василевская. Радуга" (1944), "Б. Горбатов. Покоритчытӧмъяс" (1945), "К. Станюкович. Морскӧй висьтъяс" (1947), "Л. Воронцова. Карса нывка" (1947), "К. Маркс, Ф. Энгельс. Коммунистическӧй партиялӧн манифест" (1948), "М. Горький. Менам университетъяс" (1948), "Л. Кассиль. Менам дона детинкаяс" (1948), "А. Мусатов. Стожары" (1950), "И. Ликстанов. Малышок" (1950), "И. Василенко. Звёздочка" (1950), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), "Е. Кошевая. Пи йылысь повесть" (1951), "Ф. Вигдорова. Менам класс" (1951) , "Елена Ильина. Нёльӧд высота" (1951) , "А. П. Чехов. Каштанка" (1951), "Б. Полевой. Настоящӧй морт йылысь повесть" (1951), "К. Д. Ушинскӧй. Висьтъяс да мойдъяс" (1952), "И. Карнаухова. Дружнӧйяс йылысь повесть" (1952), "Г. Николаева. Вундандыр" (1952), "Максим Горький. Висьтъяс" (1952), "Б. Житков. Кыдзи бать менӧ спасайтіс" (1952), "Вера Панова. Яснӧй берег" (1952), "Н. В. Гоголь. Повесть сы йылысь, кыдзи Иван Иванович пиньӧ воис Иван Никифоровичкӧд" (1952) , "Л. Космодемьянская. Зоя да Шура йылысь повесть" (1952), "М. Прилежаева. Ёртъясыд тэкӧд" (1952), "Чуковскӧй К. И. Доктор Айболит" (1952), "М. Горький. Дед Архип и Лёнька" (1953), "А. Фадеев. Молодая гвардия" (1953), "Л. Н. Толстой. Кавказскӧй пленник" (1953) , "М. Лермонтов. Миян кадся герой" (1953) , "Сергей Розанов. Травкалӧн приключениеяс" (1953) , "В. Осеева. Васёк Трубачёв да сылӧн ёртъясыс. Коймӧд книга" (1953), "Н. Бирюков. Чайка" (1953), "Н. Никитин. Войвывса Аврора" (1953), "Д. Н. Мамин-Сибиряк. Висьтъяс" (1953), "Георгиевская С. М. Бабушкалӧн море" (1953), "Н. Носов. Витя Малеев школаын да гортас" (1953), "В. Короленко. Синтӧм музыкант" (1953), "Юлиус Фучик. Казнь водзвылын кыв" (1953), "А. С. Серафимович. Рассказъяс" (1954), "Ю. Сотник. Аддзывлытӧм лэбач" (1954), "Иосиф Дик. Би шор" (1954), "Г. И. Успенский. Растеряевӧй улича вылын оланног" (1954), "А. П. Чехов. Рассказъяс" (1954), "А. Батров. Миян друг Хосе" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. С. Лесков. Рассказъяс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Воронкова Л. Алтайскӧй повесть" (1954), "Иван Франко. Рассказъяс" (1954), "А. Кононов. Сокольникиын ёлка" (1954), "Н. Дубов. Му помасянінын" (1954), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "В. Баныкин. Тулысын ытва дырйи" (1955), "А. Кононов. Вернӧй сьӧлӧм" (1955), "П. Кальма. Горчичнӧй райысь челядь" (1955), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Вадим Собко. Мирлӧн залог" (1955), "С. Антонов. «Веж луг»" (1955 ), "Н. Островский. Кыдзи калитчис сталь" (1955), "С. Диковскӧй. «Смелӧй» катерлӧн приключениеяс" (1956), "Короленко В. Г. Кыв тӧдтӧг" (1956), "А. П. Чехов. Канитель да мукӧд рассказъяс" (1956), "Л. Воронцова. Беспокойнӧй морт" (1956), "Н. Шундик. Ылі войвылын" (1956), "В. Кочетов. Журбинъяс" (1956), "М. Горький. Мам" (1957), "Э. Войнич. Овод" (1957), "Л. Н. Толстой. Бӧрйӧм гижӧдъяс" (1957), "В. Дуров. Менам зверьяс" (1958), "Д. Дэфо. Робинзон Крузо..." (1958), "В. Тендряков. Повесть да рассказъяс" (1958), "М. Шолохов. Мортлӧн судьба" (1958), "Михаил Шолохов. Лэптӧм эжа. 1 юкӧн" (1958), "А. Чумаченко. Тӧлысьвывса морт" (1958), "Н. Носов. Ичӧтик гажа семья" (1958), "Джек Лондон. Рассказъяс" (1958), "А. Гайдар. Барабанщиклӧн судьба" (1958), "С. Воронин. Ковтӧм слава" (1958), "М. Коршунов. Черёмушкиын керка" (1959), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "И. Василенко. Рассказъяс" (1959), "В. Бонч-Бруевич. Миян Ильич" (1959), "А. Авдеенко. Тисса дорын" (1959), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960), "М. А. Шолохов. Лэптӧм эжа. Мӧд книга" (1961), "Анатолий Мошковский. Веж гыяс" (1961), "Виктор Баныкин. Чапаев йылысь висьтъяс" (1962), "Сергей Баруздин. Выль сикт" (1963), "Л. Воронкова. Звёздочкаса командир" (1963), "Г. Карпенко. Куим звӧнок" (1964), "Виктор Баныкин. Вильыш детинка" (1964), "А. Кононов. Смольнӧйын" (1966), "С. Виноградская. Юбиляр" (1969), "Предпутие. Туйводз 2" (2021); включение данных текстов в параллельный корпус.

2.3. Первичное выравнивание в программе WinMerge текстов русских переводов с коми оригиналами изданий "Иван Торопов. Тіянлы водзӧ овны" (1980) и "В. Юхнин. Биа нюр" (1952) для корпуса параллельных текстов.

2.4. Выравнивание в программе WinMerge параллельных текстов официально-делового стиля на коми и русском языках из издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1998 №№ 7-12, 1999 №№1-12, 2000 №№1-12, 2001 №№1-12).

2.5. Повторное выравнивание по предложениям в программе WinMerge после автоматической разбивки в новом парсере параллельных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2017, 2018, 2019, 2020 гг.

2.6. Распознавание в программе ABBYY FineReader и метаразметка русскоязчных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" за 2000 и 2001 гг. для дальнейшего выравнивания с соответствующими текстами коми переводов.

2.7. Распознавание в программе ABBYY FineReader русскоязчычного текста на старой орфографии издания "Д. Н. Маминъ-Сибирякъ. Дѣдушкино золото" (1912) для выравнивания с коми переводом.

2.8. Выборочный перевод с русского языка на коми язык текстов новостной ленты официального сайта администрации МОГО "Сыктывкар" для корпуса параллельных текстов.

2.9. Продолжение перевода с русского языка на коми язык текстов учебного пособия "География Коми АССР" (1987) для корпуса параллельных текстов и образовательного портала "Коми мутӧдӧм".

2.10. Разбивка на предложения коми и русских текстов новостной ленты Официального портала Республики Коми с марта 2001 по сентябрь 2022 г.,  повторное выравнивание оригиналов и переводов в программе WinMerge.

2.11. Оптимизация структуры таблицы выравненных и готовых к выравниванию текстов на вспомогательном wiki-сайте лаборатории.

2.12. Внесение изменений в список исключений и добавление условий в программу разбивки параллельных текстов на предложения.

2.13. Подготовка Русско-коми словаря лексем, фраз и выражений, используемых при локализации операционных систем, программного обеспечения, браузеров и сайтов.

2.14. Разработка веб-ресурса "Параллельный русско-коми корпус" для первичной обработки параллельных текстов на двух языках.

2.15. Создание онлайн сервиса для стандартизации, максимальной парцелляции и финальной обработки параллельных текстов перед загрузкой в базу нейросети.

2.16. Тестирование нейросети по возможностям перевода для пары языков русский-коми на базе 300 000 параллельных предложений из кластера "Беллетристика".

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Э. Гофман.  Щелкунчик да шыръяслӧн король" (1940), "О. Иваненко.  Тараслӧн доля" (1941), "Л. Воронкова. Карса нывка" (1947), "Кассиль Л. А. Менам дона детинкаяс" (1948), "И. Д. Василенко.  Звездочка" (1950), "Д. Н. Мамин-Сибиряк.  Кыйсьысь Емеля" (1950), "А. Мусатов. Стожары" (1950), "А. Голубева. Уржумысь детинка" (1951), "Гримм вокъяс. Бременса музыкантъяс" (1951), "А. П. Чехов.  Каштанка" (1951), "К. И. Чуковскӧй. Доктор Айболит" (1952), "Гайдар А. П. Ылысса странаяс" (1952), "Г. Николаева. Вундандыр" (1952), "Максим Горький. Архип дед да Лёнька" (1953), "С. М. Георгиевская. Бабушкалӧн море" (1953), "С. Т. Григорьев.  Суворов" (1953), "Н. Бирюков. Чайка" (1953), "В. Г. Короленко. Синтӧм музыкант" (1953), "Н. Н. Носов. Витя Малеев школаын да гортас" (1953), "Н. И. Дубов. Му помасянінын" (1954), "Л. Воронкова. Алтайскӧй повесть" (1954), "Н. В. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. И. Дубов. Ю вылын бияс" (1954), "А. Пушкин. Дубровский" (1954), "Л. Толстой. Рассказъяс" (1954), "Максим Горький. Рассказъяс" (1954), "В. И. Баныкин. Тулысын ытва дырйи" (1955), "Н. Островский. Кыдзи калитчис сталь" (1955), "А. С. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "М. Е. Салтыков-Щедрин. Мойдъяс"  (1955), "Л. Воронкова. Беспокойнӧй морт" (1956), "Б. Емельянов. Мечта"  (1957), "Н. Дубов. Сирӧта" (1957), "М. Марьенков. Дружба" (1958), "С. А. Воронин. Ковтӧм слава" (1958), "Д. Дэфо. Робинзон Крузо..." (1958), "И. Д. Василенко. Рассказъяс" (1959), "А. Г. Алексин. Комын ӧти лун" (1959), "Л. Воронкова. Ичӧтик зарни ключьяс" (1959), "В. Панова. Сережа" (1960), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960), "Г. М. Кржижановский. Шу-Шу" (1969), "Туйводз-2" (2021).

3.2. Распознавание в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов переводных изданий: "Л. Воронцова. Карса нывка" (1947), "Л. Кассиль. Менам дона детинкаяс" (1948), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), "И. Василенко. Звёздочка" (1950), "А. Мусатов. Стожары" (1950), "Н. Носов. Витя Малеев школаын да гортас" (1953) "А. П. Чехов. Каштанка" (1951), "Г. Николаева. Вундандыр" (1952), "Чуковскӧй К. И. Доктор Айболит" (1952), "Георгиевская С. М. Бабушкалӧн море" (1953), "В. Короленко Синтӧм музыкант" (1953), "Н. Бирюков. Чайка" (1953), "М. Горький. Дед Архип и Лёнька" (1953), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "Воронкова Л. Алтайскӧй повесть" (1954), "Н. Дубов. Му помасянінын" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. Островский. Кыдзи калитчис сталь" (1955), "В. Баныкин. Тулысын ытва дырйи" (1955), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Л. Воронцова. Беспокойнӧй морт" (1956), "Д. Дэфо. Робинзон Крузо..." (1958), "С. Воронин. Ковтӧм слава" (1958), "И. Василенко. Рассказъяс" (1959), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "М. Жестева. Ичӧтик трактористлӧн приключениеяс" (1960), "Туйводз-2" (2021), "Вын" (2022).

3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№№39-51), журналов "Йӧлӧга" (2022. №№7, 8, 9) и "Войвыв кодзув" (2022. №№6, 7); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.

3.4. Сравнение и корректирование в программе Meld двух публикаций пьесы В. Леканова "Сиктса рытъяс" (1954 и 1988 гг.).

3.5. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.

3.6. Подписка на полный комплект электронных версий газет и журналов ГАУ РК "Издательский дом Коми" на 2023 год.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Создание цифровых копий, распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-03, 1925-01-07, 1925-01-10, 1925-01-11, 1925-01-16, 1925-01-22, 1925-01-27, 1925-01-29, 1925-02-03, 1925-02-05, 1925-02-07, 1925-02-10, их обработка в программе LibreOffice Writer и  в молодцовском корпусе.

5. Работа над пополнением коми-пермяцкого корпуса:

5.1. Сборка, метаразметка, обработка в программе gedit (унификация кавычек, тире и дефисов, замена латинских ӧ и і коми эквивалентами, устранение лишних пробелов) и загрузка в коми-пермяцкий раздел корпуса коми языка текстового контента онлайн-ресурса "Велӧтісь".

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение текстов номеров газеты "Југыԁ туј" за 1925-01-03, 1925-01-07, 1925-01-10, 1925-01-11, 1925-01-16, 1925-01-22, 1925-01-27, 1925-01-29, 1925-02-03, 1925-02-05, 1925-02-07, 1925-02-10 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".

6.2. Модернизация коми переводных текстов издания "Книга бӧрся книга. І" (1940) для размещения в онлайн библиотеке "Коми гижӧд".

6.3. Размещение в онлайн библиотеке "Коми гижӧд" текстов рассказа Д. Н. Мамина-Сибиряка "Дедлӧн зарни", сказок "Аладдин да шемӧс лампа", "Али-Баба да нелямын шыш" параллельно на коми и русском языках.

6.4. Добавление в онлайн-библиотеку "Коми гижӧд" текста учебника "Гурвиц Ю. О., Гангнус Р. В. Медводдза сведенньӧяс геометрияысь" (1934) в переводе на современную графику.

6.5. Размещение в онлайн библиотеке "Коми гижӧд" перевода повести А. де Сент-Экзюпери "Дзоля принц" (вариант Е. Цыпанова) параллельно с текстом оригинала.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1.  Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданям на коми языке: "Алтайскӧй повесть (Л. Воронкова, 1954ʼ вося небӧг)", "Архип дед да Лёнька (М. Горькӧй, 1953ʼ вося небӧг)", "Бабушкалӧн море (С. Георгиевская, 1953ʼ вося небӧг)", "Беспокойнӧй морт (Л. Воронкова, 1956ʼ вося небӧг)", "Бременса музыкантъяс (Гримм вокъяс, 1951ʼ вося небӧг)", "Витя Малеев школаын да гортас (Н. Носов, 1953ʼ вося небӧг)", "Вундандыр (Г. Николаева, 1952ʼ вося небӧг)", "Доктор Айболит (К. Чуковскӧй, 1952ʼ вося небӧг)", "Дружба (Марьенков М., 1958ʼ вося небӧг)", "Дубровскӧй (А. С. Пушкин, 1954ʼ вося небӧг)", "Звездочка (Н. Василенко, 1950ʼ вося небӧг)", "Ичӧтик зарни ключьяс (Л. Воронкова, 1959ʼ вося небӧг)", "Ичӧтик трактористлӧн приключениеяс (М. Жестев, 1960ʼ вося небӧг)", "Карса нывка (Л. Воронкова, 1947ʼ вося небӧг), "Каштанка (А. П. Чехов, 1951ʼ вося небӧг)", "Ковтӧм слава (С. Воронин, 1958ʼ вося небӧг)", "Комын ӧти лун (А. Алексин, 1959ʼ вося небӧг)", "Кыдзи калитчис сталь (Н. Островскӧй, 1955ʼ вося небӧг)", "Кыйсьысь Емеля (Д. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Менам дона детинкаяс (Л. Кассиль, 1948ʼ вося небӧг)", "Мечта (Б. Емельянов, 1957ʼ вося небӧг)", "Мореход Робинзон Крузо, сылӧн олӧм да шензьӧдана приключениеяс (Д. Дефо, 1958ʼ вося небӧг)", "Му помасянінын (Н. Дубов, 1954ʼ вося небӧг)", "Повтӧмъяс да кужысьяс йылысь (Н. Богданов, 1954ʼ вося небӧг)", "Покойнӧй Иван Петрович Белкинлӧн повестьяс (А. С. Пушкин, 1955ʼ вося небӧг)", "Предпутие. Туйводз 2 (2021' вося небӧг)", "Рассказъяс (И. Василенко, 1959ʼ вося небӧг)", "Рассказъяс (Л. Толстой, 1954ʼ вося небӧг)", "Рассказъяс (М. Горькӧй, 1954ʼ вося небӧг)", "Сережа (В. Панова, 1960ʼ вося небӧг)", "Синтӧм музыкант (В. Короленко, 1953ʼ вося небӧг)", "Сирӧта (Н. Дубов, 1957ʼ вося небӧг)", "Стожары (А. Мусатов, 1950ʼ вося небӧг)", "Суворов (С. Григорьев, 1953ʼ вося небӧг)", "Тараслӧн доля (О. Иванченко, 1941ʼ вося небӧг)", "Тулысын ытва дырйи (В. Баныкин, 1955ʼ вося небӧг)", "Уржумысь детинка (Голубева А., 1951ʼ вося небӧг)", "Чайка (Н. Бирюков, 1953ʼ вося небӧг)", "Шу-Шу  (Г. Кржижановскӧй, 1969ʼ вося небӧг)", "Щелкунчик да шыръяслӧн король (Э. Гофман, 1940ʼ вося небӧг)", "Ылысса странаяс (А. Гайдар, 1952ʼ вося небӧг)", "Ю вылын бияс (Н. Дубов, 1954ʼ вося небӧг)".

7.2. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по библиографии переводчиков: "Улитин Николай Андреевич", "Дзюба Татьяна Николаевна".

7.3. Создание ссылок на вновь созданные страницы изданий со страниц коми переводчиков на справочном wiki-ресурсе "Коми тӧданін".

7.4. Создание wiki-страниц по свежим номерам (2022 №№6,7) журнала "Войвыв кодзув" на сайте "Коми тӧданін".

7.5. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за  1925-01-03, 1925-01-07, 1925-01-10, 1925-01-11, 1925-01-16, 1925-01-22, 1925-01-27, 1925-01-29, 1925-02-03, 1925-02-05, 1925-02-07, 1925-02-10.

8. Помощь коллегам в регионах:
       
8.1. Создание wiki-пространства с поддоменом selkup.fu-lab.ru для публикации специалистами лингвистических разработок по селькупскому языку.

8.2. Добавление в виртуальную клавиатуру лексикографического ресурса dict.fu-lab.ru специфических символов тувинского алфавита: ң ө ү.

9. Пополнение лексической базы FU-Lab:

9.1. Работа по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Участие в мероприятиях:
• Проведение вебинара для воспитателей на тему «Дополнительный онлайн-инструментарий в процессе обучения коми языку» в Коми республиканском институте развития образования. (14 октября 2022 г.).
• Проведение вебинара для учителей на тему «Основные разделы корпуса коми языка, особенности настройки поиска и сортировки при работе с корпусом» в Коми республиканском институте развития образования. (18 октября 2022 г.)
• Семинар с магистрантами-регионоведами Сыктывкарского государственного университета им Питирима Сорокина по теме "Основные продукты лаборатории FU-Lab и возможности их использования". (19 октября 2022 г.)
• Выступление с сообщением на тему "Новые онлайн ресурсы для научного изучения коми языка" на XIX Международном симпозиуме "Диалекты и история пермских языков во взаимодействии с другими языками". (21 октября 2022 г.).
• Проведение русскоязчыного вебинара для педагогов на тему «Использование электронного ресурса "Портал для изучающих коми язык "Коми кыв"» в Коми республиканском институте развития образования. (17 ноября 2022 г.).
• Выступление на сыктывкарской ежегодной конференции коми народа "Комфортная городская среда в городе Сыктывкаре" с сообщением "Локализация муниципальных сайтов на коми язык" (18 ноября 2022 г.).
• Выступление на тему "Продвижение коми языка в электронном информационном пространстве" на международной конференции, организованной в Национальной библиотеке Республики Коми в рамках проведения Арктических Дельфийских игр. (26 ноября 2022 г.).
• Проведение вебинара для педагогов на тему «Распознавание коми текстов в программе ABBYY FineReader» в Коми республиканском институте развития образования (7 декабря 2022 г.).
• Участие в VI форуме «Языковая политика в Российской Федерации», выступление с докладом на тему "Продвижение коми языка в электронное информационное пространство: опыт FU-Lab" (г. Москва, 8-9 декабря 2022 г.).
• Проведение вебинара для учителей на тему «Онлайн библиотека "Коми гижӧд" и ее место в электронной инфраструктуре коми языка» в Коми республиканском институте развития образования (14 декабря 2022 г.). 

2022ʼ ӧшымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 19:22 18.12.2022

2022.11.28 – 2022.12.23

 

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf:  "Э. Гофман.  Щелкунчик да шыръяслӧн король" (1940), "О. Иваненко.  Тараслӧн доля" (1941), "Л. Воронкова. Карса нывка" (1947), "И. Д. Василенко.  Звездочка" (1950), "Д. Н. Мамин-Сибиряк.  Кыйсьысь Емеля" (1950) , "А. Голубева. Уржумысь детинка" (1951) , "Гримм вокъяс. Бременса музыкантъяс" (1951), "А. П. Чехов.  Каштанка" (1951), "К. И. Чуковскӧй. Доктор Айболит" (1952), "С. М. Георгиевская. Бабушкалӧн море" (1953), "С. Т. Григорьев.  Суворов" (1953), "В. Г. Короленко. Синтӧм музыкант" (1953), " Н. Н. Носов. Витя Малеев школаын да гортас" (1953) , "Н. И. Дубов. Му помасянінын" (1954) , "Н. В. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. И. Дубов. Ю вылын бияс" (1954), "Л. Воронкова. Беспокойнӧй морт" (1956), "М. Марьенков. Дружба" (1958) , "С. А. Воронин. Ковтӧм слава" (1958), "И. Д. Василенко. Рассказъяс" (1959), "А. Г. Алексин. Комын ӧти лун" (1959), "Л. Воронкова. Ичӧтик зарни ключьяс" (1959), "А. Пушкин. Дубровский" (1954), "Б. Емельянов. Мечта"  (1957), "Н. Дубов. Сирӧта" (1957), "В. Панова. Сережа" (1960), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960), "Л. Толстой. Рассказъяс" (1954), "М. Е. Салтыков-Щедрин. Мойдъяс"  (1955).
  4. Распознавание в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов переводных изданий: "Л. Кассиль. Менам дона детинкаяс" (1948), "Н. Дубов. Му помасянінын" (1954), "В. Баныкин. Тулысын ытва дырйи" (1955), "Л. Воронцова. Карса нывка" (1947), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Чуковскӧй К. И. Доктор Айболит" (1952), "Н. Дубов. Ю вылын бияс" (1954), "С. Воронин. Ковтӧм слава" (1958), "Л. Воронцова. Беспокойнӧй морт" (1956), "М. Горький. Дед Архип и Лёнька" (1953), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1960), И. Василенко "Звёздочка" (1950), И. Василенко "Рассказъяс" (1959), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Георгиевская С. М. Бабушкалӧн море" (1953), "Вын" (2022), "Н. Носов. Витя Малеев школаын да гортас" (1953) "А. П. Чехов. Каштанка" (1951), "В. Короленко Синтӧм музыкант" (1953).     
  5. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Чуковскӧй К. И. Доктор Айболит" (1952), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1960), И. Василенко "Звёздочка" (1950), И. Василенко "Рассказъяс" (1959), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954), "С. Воронин. Ковтӧм слава" (1958), "Л. Воронцова. Беспокойнӧй морт" (1956), "М. Горький. Дед Архип и Лёнька" (1953), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950), "Л. Кассиль. Менам дона детинкаяс" (1948), "Н. Дубов. Му помасянінын" (1954), "В. Баныкин. Тулысын ытва дырйи" (1955), "Л. Воронцова. Карса нывка" (1947), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "А. Авдеенко. Тисса дорын" (1959), "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Георгиевская С. М. Бабушкалӧн море" (1953), "Н. Носов. Витя Малеев школаын да гортас" (1953), "А. П. Чехов. Каштанка" (1951), "В. Короленко. Синтӧм музыкант" (1953).
  6. Размещение в онлайн библиотеке "Коми гижӧд" перевода повести А. де Сент-Экзюпери "Дзоля принц" (вариант Е. Цыпанова) параллельно с текстом оригинала.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданям на коми языке: "Архип дед да Лёнька (1953ʼ вося небӧг)", "Бабушкалӧн море (С. Георгиевская, 1953ʼ вося небӧг)", "Беспокойнӧй морт (Л. Воронкова, 1956ʼ вося небӧг)", "Бременса музыкантъяс (1951ʼ вося небӧг)", "Витя Малеев школаын да гортас (Н. Носов, 1953ʼ вося небӧг)", "Доктор Айболит (К. Чуковскӧй, 1952ʼ вося небӧг)", "Дружба (Марьенков М., 1958ʼ вося небӧг)", "Ичӧтик зарни ключьяс (Л. Воронкова, 1959ʼ вося небӧг)", "Карса нывка (Л. Воронкова, 1947ʼ вося небӧг), "Каштанка (А. П. Чехов, 1951ʼ вося небӧг)", "Ковтӧм слава (С. Воронин, 1958ʼ вося небӧг)", "Комын ӧти лун (А. Алексин, 1959ʼ вося небӧг)", , "Кыйсьысь Емеля (Д. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Менам дона детинкаяс (1948ʼ вося небӧг)", "Му помасянінын (Н. Дубов, 1954ʼ вося небӧг)", "Повтӧмъяс да кужысьяс йылысь (Н. Богданов, 1954ʼ вося небӧг)", "Покойнӧй Иван Петрович Белкинлӧн повестьяс (1955ʼ вося небӧг)", "Рассказъяс (И. Василенко, 1959ʼ вося небӧг)", "Рассказъяс (М. Горькӧй, 1954ʼ вося небӧг)", "Синтӧм музыкант (В. Короленко, 1953ʼ вося небӧг)", "Суворов (С. Григорьев, 1953ʼ вося небӧг)", "Тараслӧн доля (1941ʼ вося небӧг)", "Тулысын ытва дырйи (1955ʼ вося небӧг)", "Уржумысь детинка (Голубева А., 1951ʼ вося небӧг)", "Шу-Шу : В. И. Ленин йылысь казьтылӧмъясысь (1969ʼ вося небӧг)", "Щелкунчик да шыръяслӧн король (1940ʼ вося небӧг)", "Ылысса странаяс (1952ʼ вося небӧг)", "Ю вылын бияс (Н. Дубов, 1954ʼ вося небӧг)", "Звездочка (Н. Василенко, 1950ʼ вося небӧг)", "Сирӧта (Н. Дубов, 1957ʼ вося небӧг)", "Мечта (Б. Емельянов, 1957ʼ вося небӧг)", "Ичӧтик трактористлӧн приключениеяс (М. Жестев, 1960ʼ вося небӧг)", "Сережа (В. Панова, 1960ʼ вося небӧг)", "Дубровскӧй (А. С. Пушкин, 1954ʼ вося небӧг)", "Рассказъяс (Л. Толстой, 1954ʼ вося небӧг)".    
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по библиографии переводчиков: "Улитин Николай Андреевич", "Дзюба Татьяна Николаевна".
  9. Создание ссылок на вновь созданные страницы изданий со страниц коми переводчиков на справочном wiki-ресурсе "Коми тӧданін".
  10. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№№ 48, 40, 50, 51); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-03, 1925-02-05, 1925-02-07, 1925-02-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".    
  12. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.   
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.    
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  16. Проведение вебинара для педагогов на тему «Распознавание коми текстов в программе ABBYY FineReader» в Коми республиканском институте развития образования (7 декабря 2022 г.).
  17. Участие в VI форуме «Языковая политика в Российской Федерации» (г. Москва, 8-9 декабря 2022 г.), выступление с докладом на тему "Продвижение коми языка в электронное информационное пространство: опыт FU-Lab".
  18. Проведение вебинара для учителей на тему «Онлайн библиотека "Коми гижӧд" и ее место в электронной инфраструктуре коми языка» в Коми республиканском институте развития образования (14 декабря 2022 г.).
FU-Lab 2022.12.19 – 2022.12.23

опубликовал Öньö Лав в 19:20 18.12.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.12.19 – 2022.12.23

 

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Повторное сканирование страниц книги "Николай Дубов. Сирӧта" (1957), оказавшихся дефектными в ранее отсканированном экземпляре. Обновление pdf копии данного издания.
  4. Распознавание и вычитка в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов переводных изданий: "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Георгиевская С. М. Бабушкалӧн море" (1953), "Вын" (2022), "Н. Носов. Витя Малеев школаын да гортас" (1953) "А. П. Чехов. Каштанка" (1951), "В. Короленко Синтӧм музыкант" (1953).
  5. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "А. Авдеенко. Тисса дорын" (1959), "Н. Дубов. Ю вылын бияс" (1954), "Н. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Георгиевская С. М. Бабушкалӧн море" (1953), "Н. Носов. Витя Малеев школаын да гортас" (1953), "А. П. Чехов. Каштанка" (1951), "В. Короленко. Синтӧм музыкант" (1953).
  6. Размещение в онлайн библиотеке "Коми гижӧд" перевода повести А. де Сент-Экзюпери "Дзоля принц" (вариант Е. Цыпанова) параллельно с текстом оригинала.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по библиографии переводчиков: "Улитин Николай Андреевич", "Дзюба Татьяна Николаевна".
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№51); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
FU-Lab 2022.12.12 – 2022.12.16

опубликовал Öньö Лав в 19:21 15.12.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.12.12 – 2022.12.16

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf:  "Л. Толстой. Рассказъяс" (1954), "М. Е. Салтыков-Щедрин. Мойдъяс"  (1955).
  4. Распознавание в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов переводных изданий: М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1960), И. Василенко "Звёздочка" (1950), И. Василенко "Рассказъяс" (1959), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954)
  5. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "Чуковскӧй К. И. Доктор Айболит" (1952), М. Жестева "Ичӧтик трактористлӧн приключениеяс" (1960), И. Василенко "Звёздочка" (1950), И. Василенко "Рассказъяс" (1959), "Л. Толстой. Рассказъяс" (1954), "А. Пушкин. Дубровский" (1954).
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Рассказъяс (Л. Толстой, 1954ʼ вося небӧг)".
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№49, 50); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словаря поддержки коми языка программы ABBYY FineReader новыми словоформами, выявленными в текущем году в обработанных текстах.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Проведение вебинара для учителей на тему «Онлайн библиотека "Коми гижӧд" и ее место в электронной инфраструктуре коми языка» в Коми республиканском институте развития образования (14 декабря 2022 г.).
FU-Lab 2022.12.05 – 2022.12-09

опубликовал Öньö Лав в 18:39 07.12.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.12.05 – 2022.12-09
     

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf:  "А. Пушкин. Дубровский" (1954), "Б. Емельянов. Мечта"  (1957), "Н. Дубов. Сирӧта" (1957), "В. Панова. Сережа" (1960), "М. Жестев. Ичӧтик трактористлӧн приключениеяс" (1960).
  4. Распознавание в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов переводных изданий: "Чуковскӧй К. И. Доктор Айболит" (1952), "Н. Дубов. Ю вылын бияс" (1954), "С. Воронин. Ковтӧм слава" (1958), "Л. Воронцова. Беспокойнӧй морт" (1956), "М. Горький. Дед Архип и Лёнька" (1953), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950)
  5. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса по изданиям: "С. Воронин. Ковтӧм слава" (1958), "Л. Воронцова. Беспокойнӧй морт" (1956), "М. Горький. Дед Архип и Лёнька" (1953), "Д. Мамин-Сибиряк. Кыйсьысь Емеля" (1950)
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданям на коми языке: "Звездочка (Н. Василенко, 1950ʼ вося небӧг)", "Сирӧта (Н. Дубов, 1957ʼ вося небӧг)", "Мечта (Б. Емельянов, 1957ʼ вося небӧг)", "Ичӧтик трактористлӧн приключениеяс (М. Жестев, 1960ʼ вося небӧг)", "Сережа (В. Панова, 1960ʼ вося небӧг)", "Дубровскӧй (А. С. Пушкин, 1954ʼ вося небӧг)" (http://wiki.komikyv.org);
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-05, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  11. Проведение вебинара для педагогов на тему «Распознавание коми текстов в программе ABBYY FineReader» в Коми республиканском институте развития образования (7 декабря 2022 г.).
  12. Участие в VI форуме «Языковая политика в Российской Федерации» (г. Москва, 8-9 декабря 2022 г.)
FU-Lab 2022.11.28 – 2022.12-02

опубликовал Öньö Лав в 17:26 01.12.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.11.28 – 2022.12-02

  1.  
  2. Продолжение перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf:  "Э. Гофман.  Щелкунчик да шыръяслӧн король" (1940), "О. Иваненко.  Тараслӧн доля" (1941), "Л. Воронкова. Карса нывка" (1947), "И. Д. Василенко.  Звездочка" (1950), "Д. Н. Мамин-Сибиряк.  Кыйсьысь Емеля" (1950) , "А. Голубева. Уржумысь детинка" (1951) , "Гримм вокъяс. Бременса музыкантъяс" (1951), "А. П. Чехов.  Каштанка" (1951), "К. И. Чуковскӧй. Доктор Айболит" (1952), "С. М. Георгиевская. Бабушкалӧн море" (1953), "С. Т. Григорьев.  Суворов" (1953), "В. Г. Короленко. Синтӧм музыкант" (1953), " Н. Н. Носов. Витя Малеев школаын да гортас" (1953) , "Н. И. Дубов. Му помасянінын" (1954) , "Н. В. Богданов. Повтӧмъяс да кужысьяс йылысь" (1954), "Н. И. Дубов. Ю вылын бияс" (1954), "Л. Воронкова. Беспокойнӧй морт" (1956), "М. Марьенков. Дружба" (1958) , "С. А. Воронин. Ковтӧм слава" (1958), "И. Д. Василенко. Рассказъяс" (1959), "А. Г. Алексин. Комын ӧти лун" (1959), "Л. Воронкова. Ичӧтик зарни ключьяс" (1959).
  4. Распознавание в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка текстов переводных изданий: "Л. Кассиль. Менам дона детинкаяс" (1948), "Н. Дубов. Му помасянінын" (1954), "В. Баныкин. Тулысын ытва дырйи" (1955), "Л. Воронцова. Карса нывка" (1947), "Л. Воронцова. Ичӧтик зарни ключьяс" (1959), "А. Пушкин. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955).
  5. Первичное выравнивание в программе WinMerge указанных в преыдущем пункте коми текстов с русскоязычными эквивалентами для параллельного корпуса.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданям на коми языке: "Архип дед да Лёнька (1953ʼ вося небӧг)", "Бабушкалӧн море (С. Георгиевская, 1953ʼ вося небӧг)", "Беспокойнӧй морт (Л. Воронкова, 1956ʼ вося небӧг)", "Бременса музыкантъяс (1951ʼ вося небӧг)", "Витя Малеев школаын да гортас (Н. Носов, 1953ʼ вося небӧг)", "Доктор Айболит (К. Чуковскӧй, 1952ʼ вося небӧг)", "Дружба (Марьенков М., 1958ʼ вося небӧг)", "Ичӧтик зарни ключьяс (Л. Воронкова, 1959ʼ вося небӧг)", "Карса нывка (Л. Воронкова, 1947ʼ вося небӧг), "Каштанка (А. П. Чехов, 1951ʼ вося небӧг)", "Ковтӧм слава (С. Воронин, 1958ʼ вося небӧг)", "Комын ӧти лун (А. Алексин, 1959ʼ вося небӧг)", , "Кыйсьысь Емеля (Д. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Менам дона детинкаяс (1948ʼ вося небӧг)", "Му помасянінын (Н. Дубов, 1954ʼ вося небӧг)", "Повтӧмъяс да кужысьяс йылысь (Н. Богданов, 1954ʼ вося небӧг)", "Покойнӧй Иван Петрович Белкинлӧн повестьяс (1955ʼ вося небӧг)", "Рассказъяс (И. Василенко, 1959ʼ вося небӧг)", "Рассказъяс (М. Горькӧй, 1954ʼ вося небӧг)", "Синтӧм музыкант (В. Короленко, 1953ʼ вося небӧг)", "Суворов (С. Григорьев, 1953ʼ вося небӧг)", "Тараслӧн доля (1941ʼ вося небӧг)", "Тулысын ытва дырйи (1955ʼ вося небӧг)", "Уржумысь детинка (Голубева А., 1951ʼ вося небӧг)", "Шу-Шу : В. И. Ленин йылысь казьтылӧмъясысь (1969ʼ вося небӧг)", "Щелкунчик да шыръяслӧн король (1940ʼ вося небӧг)", "Ылысса странаяс (1952ʼ вося небӧг)", "Ю вылын бияс (Н. Дубов, 1954ʼ вося небӧг)".
  7. Создание ссылок на вновь созданные страницы изданий со страниц коми переводчиков на справочном wiki-ресурсе "Коми тӧданін"
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№48); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-02-03, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности. 
2022ʼ вӧльгымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 14:12 24.11.2022

 

  1.  
  2. Продолжение сплошного перевода с русского языка на коми язык стабильных текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Выборочный перевод с русского языка на коми язык текстов новостной ленты официального сайта администрации МОГО "Сыктывкар" для корпуса параллельных текстов.
  4. Продолжение перевода с русского языка на коми язык текстов учебного пособия "География Коми АССР" (1987) для корпуса параллельных текстов и образовательного портала "Коми мутӧдӧм".
  5. Сканирование в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Кассиль Л. А. Менам дона детинкаяс" (1948), "Гайдар А. П. Ылысса странаяс" (1952), "Максим Горький. Архип дед да Лёнька" (1953), "Максим Горький. Рассказъяс" (1954), "Баныкин В. И. Тулысын ытва дырйи" (1955), "Пушкин А. С. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Кржижановскӧй Г. М. Шу-Шу" (1969).
  6. Сканирование и распознавание в программе FineReader, создание электронных копий в формате pdf и обработка текстов в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) переводных книжных изданий "Воронкова Л. Алтайскӧй повесть" (1954), "Н. Бирюков. Чайка" (1953), "Д. Дэфо. Робинзон Крузо..." (1958), "Н. Островский. Кыдзи калитчис сталь" (1955), "Туйводз-2" (2021), "А. Мусатов. Стожары" (1950), "Г. Николаева. Вундандыр" (1952). По данным изданиям также созданы и заполнены wiki-cтраницы в онлайн справочнике "Коми тӧданін", тексты включены в корпус коми языка.
  7. Распознавание в программе ABBYY FineReader русскоязчычного текста на старой орфографии издания "Д. Н. Маминъ-Сибирякъ. Дѣдушкино золото" (1912) для выравнивания с коми переводом.
  8. Модернизация коми переводных текстов издания "Книга бӧрся книга. І" (1940) для размещения в онлайн библиотеке "Коми гижӧд".
  9. Размещение в онлайн библиотеке "Коми гижӧд" текстов рассказа Д. Н. Мамина-Сибиряка "Дедлӧн зарни", сказок "Аладдин да шемӧс лампа", "Али-Баба да нелямын шыш" параллельно на коми и русском языках.
  10. Выравнивание коми и русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" за 2000 и 2001 гг. для параллельного коми-русского корпуса, попутно созданы метаразметки для русскоязычных текстов.
  11. Оптимизация структуры таблицы выравненных и готовых к выравниванию текстов на вспомогательном wiki-сайте лаборатории.
  12. Первичное выравнивание в программе WinMerge коми и русских текстов переводных изданий "Дж. Лондон. Мексиканец" (1938), "А. С. Новиков-Прибой. Цусима" (1940), "Книга бӧрся книга. І" (1940), "Н. Никитин. Войвывса Аврора" (1953), "Д. Н. Мамин-Сибиряк. Висьтъяс" (1953), "Л. Н. Толстой. Хаджи Мурат" (1939), "С. Степняк-Кравчинскӧй. Андрей Кожухов" (1940), "И. Ликстанов. Малышок" (1950), "К. Д. Ушинскӧй. Висьтъяс да мойдъяс" (1952), "И. Карнаухова. Дружнӧйяс йылысь повесть" (1952), "А. С. Серафимович. Рассказъяс" (1954), "Ю. Сотник. Аддзывлытӧм лэбач" (1954), "Иосиф Дик. Би шор" (1954), "Г. И. Успенский. Растеряевӧй улича вылын оланног" (1954), "Д. Дэфо. Робинзон Крузо..." (1958), "Б. Житков. Кыдзи бать менӧ спасайтіс" (1952), "Н. Бирюков. Чайка" (1953), "Иван Франко. Рассказъяс" (1954), "А. Кононов. Сокольникиын ёлка" (1954), "С. Антонов. «Веж луг»" (1955 ), "Н. Островский. Кыдзи калитчис сталь" (1955), "С. Диковскӧй. «Смелӧй» катерлӧн приключениеяс" (1956), "Короленко В. Г. Кыв тӧдтӧг" (1956), "Л. Н. Толстой. Бӧрйӧм гижӧдъяс" (1957), "М. Шолохов. Мортлӧн судьба" (1958), "Михаил Шолохов. Лэптӧм эжа. 1 юкӧн" (1958), "А. Чумаченко. Тӧлысьвывса морт" (1958), "Н. Носов. Ичӧтик гажа семья" (1958), "Джек Лондон. Рассказъяс" (1958), "В. Бонч-Бруевич. Миян Ильич" (1959), "Анатолий Мошковский. Веж гыяс" (1961), "Виктор Баныкин. Чапаев йылысь висьтъяс" (1962), "Сергей Баруздин. Выль сикт" (1963), "Л. Воронкова. Звёздочкаса командир" (1963), "Г. Карпенко. Куим звӧнок" (1964), "Виктор Баныкин. Вильыш детинка" (1964), "А. Кононов. Смольнӧйын" (1966), "С. Виноградская. Юбиляр" (1969), "А. Батров. Миян друг Хосе" (1954), "Максим Горький. Висьтъяс" (1952), "В. Дуров. Менам зверьяс" (1958), "Вашингтон Ирвинг. Рип Ван Винкль" (1939), "Н. С. Лесков. Рассказъяс" (1954), "Марк Твен. Чеччалысь лягуша" (1939), "М. Е. Салтыков-Щедрин. Бӧрйӧм гижӧдъяс" (1939), "К. Станюкович. Морскӧй висьтъяс" (1947), "В. Тендряков. Повесть да рассказъяс" (1958), "Юлиус Фучик. Казнь водзвылын кыв" (1953), "А. П. Чехов. Рассказъяс" (1954), "М. А. Шолохов. Лэптӧм эжа. Мӧд книга" (1961), "А. Мусатов. Стожары" (1950), "Г. Николаева. Вундандыр" (1952), "Воронкова Л. Алтайскӧй повесть" (1954), "Предпутие. Туйводз 2" (2021); включение данных текстов в параллельный корпус.
  13. Первичное выравнивание в программе WinMerge текстов русских переводов с коми оригиналами изданий "Иван Торопов. Тіянлы водзӧ овны" (1980) и "В. Юхнин. Биа нюр" (1952) для корпуса параллельных текстов.
  14. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№43-47); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  15. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-11, 1925-01-16, 1925-01-22, 1925-01-27 и 1925-01-29, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  16. Сравнение и корректирование в программе Meld двух публикаций пьесы В. Леканова "Сиктса рытъяс" (1954 и 1988 гг.) для редакции журнала "Войвыв кодзув".
  17. Добавление в виртуальную клавиатуру лексикографического ресурса dict.fu-lab.ru специфических символов тувинского алфавита: ң ө ү.
  18. Создание wiki-пространства с поддоменом selkup.fu-lab.ru для публикации специалистами лингвистических разработок по селькупскому языку.
  19. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  20. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  21. Распространение комиязычного контента в соц. сетях.
  22. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  23. Тестирование нейросети по возможностям перевода для пары языков русский-коми на базе 300 000 параллельных предложений из кластера "Беллетристика".
  24. Подписка на полный комплект электронных версий газет и журналов ГАУ РК "Издательский дом Коми" на 2023 год.
  25. Сбор и систематизация материалов, представленных на конкурс лучших методических разработок с использованием электронных ресурсов Центра инновационных языковых технологий Дома дружбы народов Республики Коми, и составление экспертного листа для подведения итогов конкурса.
  26. Регистрация участников республиканского форума "Мы россияне" (2022-10-28).
  27. Проведение русскоязчыного вебинара для педагогов на тему «Использование электронного ресурса "Портал для изучающих коми язык "Коми кыв"» в Коми республиканском институте развития образования. (2022-11-17)
  28. Выступление на сыктывкарской ежегодной конференции коми народа "Комфортная городская среда в городе Сыктывкаре" с сообщением "Локализация муниципальных сайтов на коми язык" (2022-11-18)
  29. Выступление на тему "Продвижение коми языка в электронном информационном пространстве" на международной конференции, организованной в Национальной библиотеке Республики Коми в рамках проведения Арктических Дельфийских игр. (2022-11-26)
Яндекс.Метрика