опубликовал Öньö Лав в 10:15 13.10.2021
опубликовал Öньö Лав в 16:48 11.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 04.10.2021–08.10.2021.
1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2015 год для дальнейшего редактирования, метаразметки и выравнивания.
2. Сборка, редактирование и метаразметка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2016 год для дальнейшего выравнивания.
3. Редактирование, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за январь-апрель 2021 года.
3. Выравнивание в программе WinMerge дополнительных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2012 год.
4. Сканирование изданий: География Коми АССР. 7 класс. 1987; География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018
5. Распознавание в программе ABBYY FineReader изданий: География Коми АССР. 7 класс. 1987; География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018; Зарни Люся. Олӧмлы ода. 2014.
6. Размещение произведений автора Зарни Люся в коми онлайн библиотеке. Размещено 82 произведения из книжных изданий и 15 из журнальных публикаций.
7. Создание гиперссылок на сайте "Коми тӧданін" к произведениям, указанным в п. 6.
8. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".
9. Извлечение из pdf файлов текстов журнала "Войвыв кодзув" (№№2-9 за 2021 г.). Начало обработки данных текстов: выравнивание абзацев, проверка орфографии, метаразметка, языковые тэги, оформление на сайте
10. Извлечение/сборка и обработка текстов газеты "Коми му" (2021 №40), журнала "Йӧлӧга" (2021 №9), сайта "Изьватас" и актуальных текстов новостных порталов РК для включения в корпус коми языка.
11. Включение указанных в п. 10 текстов, а также дополнительных текстов НПА РК за 2012 г. в базу корпуса коми языка. Обновление корпуса.
12. Распространение комиязычного контента в соц. сетях.
13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 16:48 11.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 27.09.2021–01.10.2021.
1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2016 год для дальнейшего выравнивания.
2. Метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2019 г. и 2012 г.
3. Выравнивание параллельных текстов на коми и русском языках в программе WinMerge по изданию П. Бажов "Сказъяс" (1953) и соответствующим русскоязычным публикациям.
4. Подготовка текста издания Коми му_2021_№39 и актуальных текстов новостных порталов РК для включения в корпус коми языка.
5. Включение указанных в п. 4. текстов, а также текстов нормативно-правовых актов РК за 2019 г. в корпус коми языка; обновление корпуса.
6. Библиографирование издания "Ӧттор-мӧдтор йылысь (В.Е.Напалковлӧн 2021' вося небӧг)" и создание ссылок на страницах писателей в ресурсе http://wiki.komikyv.org.
7. Пополнение библиографии газетных публикаций на сайте "Коми тӧданін"
*газета "Коми му" №№12-39 за 2021 г.
*журнал "Йӧлӧга" №№2-12 за 2020 и №№1-8 за 2021 гг.
Иное:
Распространение комиязычного контента в соц. сетях.
Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 20:01 10.10.2021
опубликовал Öньö Лав в 17:51 30.09.2021
опубликовал Öньö Лав в 10:36 14.09.2021
опубликовал Öньö Лав в 13:27 07.08.2021
опубликовал Öньö Лав в 12:42 05.08.2021
+ Заканчивается оплата имени komikyv.org.
опубликовал Öньö Лав в 16:20 17.06.2021
+В Linux Mint накопилось множество обновлений, но они не устанавливаются.
опубликовал Öньö Лав в 17:11 13.05.2021
+ Необходимо сделать маркерами конца предложения такие сочетания:
!.. ?.. !» ...» ?» ... (два вида) ... — . —
опубликовал Öньö Лав в 16:04 04.05.2021
Номера большинства коми газет до 2010 года не сохранялись как пдф, только .P65 (PageMaker). Нужен конвертер с этого формата в pdf для последующего экспорта текстового слоя.
опубликовал Öньö Лав в 19:11 01.05.2021
опубликовал Öньö Лав в 11:24 27.04.2021
опубликовал Öньö Лав в 16:11 25.11.2020
опубликовал Öньö Лав в 21:33 11.11.2020
опубликовал Öньö Лав в 11:08 22.10.2020
опубликовал Öньö Лав в 10:03 21.10.2020
В коми корпусе надо в исключения добавить <koi>.
В корпусе поиск по фразе осуществляется очень-очень медленно, а временами заканчивается безрезультатно.
В кратком коми-русском топонимическом словре не работают ссылки и синонимы (Междуреченск, Изьвавом).
Надо оплатить komikyv.com макхосту.
опубликовал Öньö Лав в 11:07 08.10.2020
Йирым 5ʼ лунӧ вӧчим шыпаспӧв тэчасног нивхъяслы. Лунтыр выльмӧдім Коми кыв корпус.
Йирым 6ʼ лунӧ петіс уджавны Катюша. Содтіс Коми муяс да Йӧлӧгаяс. Ветлі Бикиньясла Маршак небӧгаинӧ.
Йирым 7ʼ лунӧ петіс уджавны Иннуш. Торйӧдалӧ быдмӧг-пемӧс зонаяс. Катюша сканераліс Сӧлӧ баб гижӧдъяса Би киньяс. Микӧ Вӧля вайӧдліс 6 студентӧс (4-ӧд курс), кутасны отсасьны миянлы (30 час: кыкӧн текстасясны, кыкӧн шыӧдасны кывъяс да куимӧн сканерасясны).
опубликовал Öньö Лав в 15:35 01.10.2020
Аттрибут "Орфографическая форма" перемещаем в раздел "Вариативность".
В раздел вариативность добавляем аттрибут "Орфографический вариант":
ВАРИАТИВНОСТЬ
ortho - орфографическая форма
ovar - орфографический вариант
ovarv
mvar - морфологический вариант
mvarv
fvar - фонетический вариант
fvarv
var - словообразовательный вариант (?)
varv
Выбор вариантов:
опубликовал Öньö Лав в 18:55 30.09.2020
По браузерному словарю: в wiki-инструкции сделали ссылку на магазин расширений Microsoft Edge.
По интегральному словарю: из списка незафиксированных в словарях слов удалены лексемы, присутствующие в диалектном двухтомнике; в онлайн инструментах появилась возможность поиска по xml-ке; стало отражаться её название; создана возможность добавлять и удалять статью; в новых словах обеспечено сохранение аттрибутов.
По латинской раскладке: в версии для Windows заменили нестандартный дефис стандартным (U+2010 > U+002d).
опубликовал Öньö Лав в 9:16 12.08.2020
По мнению пользователей, при поиске не надо учитывать регистр.
опубликовал Öньö Лав в 18:37 03.08.2020
опубликовал Öньö Лав в 12:37 30.07.2020
Инна файлъяс серти вежӧма Н. Куратовалысь гижӧдъяс ККК-ысь, унджыклаӧ колӧ бӧр содтыны юриндалысьяс. Мыйлакӧ корпусын бара лоины ЛОН-яс.
опубликовал Öньö Лав в 13:44 11.07.2020
опубликовал Öньö Лав в 17:29 09.07.2020
В разделе "Тема гижӧд" желательно сделать поиск по автору, по переводчику и по источнику. Сейчас только по названию произведения.
опубликовал Öньö Лав в 13:44 09.07.2020
1. Заменить тильду "~" на содержимое <term></term>
2. Если внутри <ex></ex> есть запятая c предшествующей точкой ".," или закрывающей скобкой ")," , то эту запятую надо заменить на </ex><ex>, а каждому примеру добавить один и тот же <ex_tr></ex_tr> , пример:
было
<ex>~ няня вв. (Мор.), ~ жытьник вв. (П.), ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>
будет
<ex>~ няня вв. (Мор.)</ex> <ex_tr>житница, амбар</ex_tr>
<ex> ~ жытьник вв. (П.)</ex> <ex_tr>житница, амбар</ex_tr>
<ex> ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>
3. Сформировать уровни <example> и <exam>
4. Все названия диалектов переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия диалектов
вв.
вс.
вым.
иж.
лл.
нв.
печ.
скр.
сс.
уд.
Если после этого названия есть текст в скобках, то он переносится вместе с названием диалекта.
5. Оставшиеся названия говоров переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия говоров
опубликовал Öньö Лав в 19:32 03.07.2020
опубликовал Öньö Лав в 18:43 25.06.2020
В прошлый раз не прокатило поднять ";". Теперь придется это сделать с новым условием. Все строки, начинающиеся с <ex> в которых нет последовательности </ex> <ex_tr> поднимаем без тэгов в предыдущую строку перед </t> или </ex_tr> (в зависимости от того, что там было в конце), отделив от предыдущего текста точкой с запятой ";".
Пример.
Сейчас:
<line>
<term>алаа</term>
<defn fut="">
<mean dial="иж.">
<t>толково</t>
<ex>красиво</ex_tr>
<ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
</mean>
</defn>
</line>
Надо:
<line>
<term>алаа</term>
<defn fut="">
<mean dial="иж.">
<t>толково; красиво</t>
<ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
</mean>
</defn>
</line>
опубликовал Öньö Лав в 18:18 22.06.2020
опубликовал Öньö Лав в 19:41 04.06.2020