Бара мытшӧдъяс

опубликовал Öньö Лав в 17:51 30.09.2021

  • (лимит повышен до 10 тыс.) В Корпусе коми языка при поиске по фразе стандартно выдает только 100 результатов.
  • + На audio.komikyv.ru на страницах с текстами появляется User warning.
  • + Интерфейс разработчиков интегрального словаря не открывается.
Выль мытшӧдъяс

опубликовал Öньö Лав в 10:36 14.09.2021

  • + Проблема с сертификатом безопасности для komikyv.org, komikyv.ru, komicorpora.ru
  • Не можем решить проблему разбивки текста в OmegaT.
  • + (Желательно сделать кнопку) В корпусе параллельных текстов БОП изъять весь контент, содержащийся между кавычками « » в следующих случаях:
    • на русском в сегментах:
      • "слова «» заменить словами «»"
      • "слово «» заменить словом «»"
      • "слова «» заменить словом «»"
      • "слово «» заменить словами «»"
      • "после слова «»"
      • "после слов «»"
      • "дополнить словами «»"
      • "дополнить словом «»"
      • "слова «» исключить"
      • "слово «» исключить"
    • на коми в сегментах
      • "«» кывъяс вежны «» кывъясӧн"
      • "«» кыв вежны «» кывйӧн"
      • "«» кывъяс вежны «» кывйӧн"
      • "«» кыв вежны «» кывъясӧн"
      • "«» кыв бӧрын"
      • "«» кывъяс бӧрын"
      • "«» кывъяс водзын"
      • "«» кыв водзын"
      • "содтыны «» кывъяс"
      • "содтыны «» кыв"
      • "«» кывъяс киритны"
      • "«» кыв киритны"
  • + Добавить виртуальную клавиатуру на Онлайн словари FU-Lab, дополнительные символы: ӓӝӟӥіҥӧӱӵӹ .
  • + В корпусе решить проблему разбивки в случае: "• Булатов И. Б. — Коми Республикаса Веськӧдлан котырӧн Юрнуӧдысьӧс Медводдза вежысь (Комиссияӧн веськӧдлысь)"
  • В корпус словарем поставить наш интегральный словарь.
  • Обновить орфографический модуль в FireFox.
  • Решить вопрос с поддержкой коми офрографии в Chrom, Edge и Opera.
  • Внедрить контекстный словарь в Opera.
Шойччан удж

опубликовал Öньö Лав в 13:27 07.08.2021

  • Роч да коми текст орччӧдігӧн казялӧм сорсьӧмъяссӧ (И., Л.) вежӧма корпусысь.
  • Ыджыд корпусӧ содтӧма Войвыв кодзув 1956 №7-12 (дасьтӧма И).
  • Ыджыд корпусӧ содтӧма Коми му да Йӧлӧга газетысь, парламент да юраланін сайтысь юнься да юлься гижӧдъяс, тестӧн замглавылысь контактса коми гижӧдъяс.
  • Небӧгаинӧ пуктӧм могысь кык файлӧ чукӧртӧма В. Л. Бабинлысь гижӧдъяс (везйӧдӧ И.)
  • Молодцов корпусӧ содтӧма гижӧдъяс 1920-22 вося коми газетъясысь (дасьтӧма ВН).
  • Молодцов корпусӧ содтӧма гижӧдъяс 1932ʼ вося небӧгъясысь: Мерајтӧмӧн пемӧсјаслыԍ ԍӧкта тӧԁмалӧм, Кроԉік віԇыԍјаслы інԁӧԁјас, Машіна ԏехԋіка паԍкалӧм, Віԇӧј вӧр сотчӧмыԍ, Кыԇі артмӧ бумага, Кыԇі вунԁавны ԁа такԍірујтны ԉесоԍекајас, Вӧр овмӧс мехаԋіԅірујтӧм, Кыԇі вӧчны бур піла, Вӧр уҗалан інструментјас, Вӧрхіміја јылыԍ, Ԏерпеԋԏін віјӧԁӧм Комі облаԍтын, Лӧԍӧԁам транспорт Комі облаԍтын соціаԉіԍԏіческӧј строіԏеԉстволы, Мыј лоӧ саԋітарнӧј міԋімум ԁа кыԇі сіјӧс нуӧԁны олӧмын, Ԋефԏ, Порԍ вӧԃітӧмын отсӧг, Ас вӧчӧм ԃеԏекторнӧј раԃіопріјомԋік, Ԃеԏекторнӧј пріјомԋік
  • Небӧгаинӧ содтӧма молодцовскӧй оригиналъяс: Мерајтӧмӧн пемӧсјаслыԍ ԍӧкта тӧԁмалӧм, Кроԉік віԇыԍјаслы інԁӧԁјас, Машіна ԏехԋіка паԍкалӧм, Віԇӧј вӧр сотчӧмыԍ, Кыԇі артмӧ бумага
  • Небӧгаинӧ содтӧма гижӧдъяс ӧнія да молодцов графикаӧн: Кыԇі вунԁавны ԁа такԍірујтны ԉесоԍекајас, Вӧр овмӧс мехаԋіԅірујтӧм, Кыԇі вӧчны бур піла, Вӧр уҗалан інструментјас, Вӧрхіміја јылыԍ, Ԏерпеԋԏін віјӧԁӧм Комі облаԍтын, Лӧԍӧԁам транспорт Комі облаԍтын соціаԉіԍԏіческӧј строіԏеԉстволы, Мыј лоӧ саԋітарнӧј міԋімум ԁа кыԇі сіјӧс нуӧԁны олӧмын. Водзджык юльын: Порԍ вӧԃітӧмын отсӧг.
New problems

опубликовал Öньö Лав в 12:42 05.08.2021

+ Заканчивается оплата имени komikyv.org.

Обновление Linux Mint

опубликовал Öньö Лав в 16:20 17.06.2021

+В Linux Mint накопилось множество обновлений, но они не устанавливаются.

Параллельные тексты

опубликовал Öньö Лав в 17:11 13.05.2021

+ Необходимо сделать маркерами конца предложения такие сочетания:
!.. ?..  !»  ...» ?» ... (два вида) ... — . —

Газеты нулевых

опубликовал Öньö Лав в 16:04 04.05.2021

Номера большинства коми газет до 2010 года не сохранялись как пдф, только .P65 (PageMaker). Нужен конвертер с этого формата в pdf для последующего экспорта текстового слоя.

Проблемы корпуса

опубликовал Öньö Лав в 19:11 01.05.2021

  • В корпусе не происходит разбивка в случае "). ". Пример при поиске по "морт" в "Медым судзсьымӧн овны / Kodko // Коми му (2021-05-27)".
  • +В корпусе проблема с инциалами. Происходит обрыв предложения по точке после каждого из инициалов.
  • +В корпусе рядом с кавычками «» искомое слово не выделяется красным цветом.
  • +В корпусе при сортировке по тексту в конце добавляются предложения с ―,  “,  •, …  . Их надо игнорировать.
  • +В корпусе не действуют исключающие теги <dict></dict> , <list></list>, их надо прописать туда, где <table></table>.
  • +В корпусе при сортировке не формат (2010-10-15 и 2010. №1) понимается как формат 2010 и соответственно по месяцу и дню сортировка не происходит. Желательно учитывать день и месяц, при этом 2010. №1 можно технически заменить на 2010-01-00 и т. д.
  • +Если в корпусе будет реализован предыдущий пункт, можно по умолчанию поставить результат поиска с сортировкой по дате в убывающем порядке (свежие даты - первые).
  • В корпусе не работает сортировка по источнику.
Апрель пом.

опубликовал Öньö Лав в 11:24 27.04.2021

  • +Надо новую версию портала на geography.komikyv.org
  • +Надо обновить Корпус коми языка
  • Коми войтыр: культура да история йылысь дженьыд серпаскывъяс (2008)-ын небӧгын абуӧсь чутікъяс.
Выль проблэмз

опубликовал Öньö Лав в 16:11 25.11.2020

  • +В корпусе предложения опять начали делиться по точке после инициала.
  • +В корпусе поиск по фразе не работает
По диалектному словарю

опубликовал Öньö Лав в 21:33 11.11.2020

  1. Цифирь
  2. В списке слов не отражается пробел между ex и ex_tr
  3. В списке оставлять только строчки с искомым словом, если не в заголовке.
  4. Вот здесь  в шестом пункте вместо "У.-И. пу розь" получилось "И. пу розь У.-". Это результат недоисправлений косяков на ранних этапах - в исходнике тот же косяк.
Вежонся удж

опубликовал Öньö Лав в 11:08 22.10.2020

  • 2020-10-16 Коми кыв корпусӧ содтӧма «Коми му» (2020), кывъяс спеллер кывкудйӧ.
  • 2020-10-18 Коми кыв корпусӧ содтӧма Адольф Туркин (1986), кывъяс спеллер кывкудйӧ (топонимъясысь ӧтдор).
  • 2020-10-19. Коми кыв корпусӧ содтӧма Святӧй Евангелльӧяс (1992). Рытнас волісны кык студентка аудио гижны (Елкина Светлана да Канева Эмилия). Драйвер жугалі. Лыдди налы лекция коми кывнас ӧнія ситуация кузя.
  • 2020-10-20. Коми кыв корпусын унифицируйтӧма небӧг пас ==n. Коми кыв корпусӧ содтӧма Нина Обрезкова (2017). Рытнас волісны кык студентка: Чупрова Олеся сканируйтіс Мишарин (2016) - колӧ выльысь вӧчны некымын лист бок, Трофимова Диана тексталіс 96 лист бок КЧА-1 (2009). Норасисны норма вылӧ.
  • 2020-10-21. Коми кыв корпусӧ содтӧма Вера Латышева (1995, 1997, 1999, 2012), кывъяс спеллер кывкудйӧ. Маршак небӧгаинысь босьтӧма «Бикиньяс» (1999-2004) сканируйтӧм могысь.
  • 2020-10-22. Коми кыв корпусӧ содтӧма Алексей Попов (1990, 1994, 2001, 2002, 2005, 2008, 2011, 2013). Рытнас сканируйтӧма 1999ʼ да 2000ʼ вося «Бикиньяс».
  • 2020-10-23. Коми кыв корпусӧ содтӧма Коми челядьлы антология (куимнан том), кывъяс спеллер кывкудйӧ. Спеллер кывкудйӧ содтӧма тшӧтш кывъяссӧ Обрезкова (2017)-ысь. Босьтчи вӧчны 1999ʼ вося Бикинь пдфкаяс.

 

Проблэмз

опубликовал Öньö Лав в 10:03 21.10.2020

В коми корпусе надо в исключения добавить <koi>.

В корпусе поиск по фразе осуществляется очень-очень медленно, а временами заканчивается безрезультатно.

В кратком коми-русском топонимическом словре не работают ссылки и синонимы (Междуреченск, Изьвавом).

Надо оплатить komikyv.com макхосту.

НИВХ ДИФ

опубликовал Öньö Лав в 11:07 08.10.2020

Йирым 5ʼ лунӧ вӧчим шыпаспӧв тэчасног нивхъяслы. Лунтыр выльмӧдім Коми кыв корпус.

Йирым 6ʼ лунӧ петіс уджавны Катюша. Содтіс Коми муяс да Йӧлӧгаяс. Ветлі Бикиньясла Маршак небӧгаинӧ.

Йирым 7ʼ лунӧ петіс уджавны Иннуш. Торйӧдалӧ быдмӧг-пемӧс зонаяс. Катюша сканераліс Сӧлӧ баб гижӧдъяса Би киньяс. Микӧ Вӧля вайӧдліс 6 студентӧс (4-ӧд курс), кутасны отсасьны миянлы (30 час: кыкӧн текстасясны, кыкӧн шыӧдасны кывъяс да куимӧн сканерасясны).

Йирым тан.

опубликовал Öньö Лав в 15:35 01.10.2020

Аттрибут "Орфографическая форма" перемещаем в раздел "Вариативность".
В раздел вариативность добавляем аттрибут "Орфографический вариант":

ВАРИАТИВНОСТЬ

ortho - орфографическая форма
ovar - орфографический вариант
ovarv
mvar - морфологический вариант
mvarv
fvar - фонетический вариант
fvarv
var - словообразовательный вариант (?)
varv

Выбор вариантов:

 

Сентябр пом

опубликовал Öньö Лав в 18:55 30.09.2020

По браузерному словарю: в wiki-инструкции сделали ссылку на магазин расширений Microsoft Edge.

По интегральному словарю: из списка незафиксированных в словарях слов удалены лексемы, присутствующие в диалектном двухтомнике; в онлайн инструментах появилась возможность поиска по xml-ке; стало отражаться её название; создана возможность добавлять и удалять статью; в новых словах обеспечено сохранение аттрибутов.

По латинской раскладке: в версии для Windows заменили нестандартный дефис стандартным (U+2010 > U+002d).

По словарю dict.komikyv.ru

опубликовал Öньö Лав в 9:16 12.08.2020

По мнению пользователей, при поиске не надо учитывать регистр.

По молодцовскому конвертеру.

опубликовал Öньö Лав в 18:37 03.08.2020

  1. При конвертации с молодцовицы на современную графику начальная і присоединяется к предыдущему слову.
  2. При конвертации с молодцовицы на современную графику сочетание ІЈ вместо ИЙ дает ІІ.
  3. При конвертации с молодцовицы на современную графику сочетание [Је вместо [Е дает [ъЕ, сочетание [Ја вместо [Я дает [ъЯ и т. п.
  4. При конвертации с молодцовицы на современную графику сочетание [Е вместо [Э дает [Е.
  5. При конвертации с молодцовицы на современную графику сочетание [І вместо [И дает [І.
2020-07-30 лунся

опубликовал Öньö Лав в 12:37 30.07.2020

Инна файлъяс серти вежӧма Н. Куратовалысь гижӧдъяс ККК-ысь, унджыклаӧ колӧ бӧр содтыны юриндалысьяс. Мыйлакӧ корпусын бара лоины ЛОН-яс.

По Молодцов корпусу

опубликовал Öньö Лав в 13:44 11.07.2020

  • При поиске по лемме не ищет слова, начинающиеся с буквы в верхнем регистре (ТО ЖЕ САМОЕ И В ОСНОВНОМ КОРПУСЕ!).
  • Расширение вправо-влево подключает рандомные (?) тексты из основного корпуса.
  • Разбивка на предложения не действует, если первая или последняя буква - молодцовская.
По небӧгаину

опубликовал Öньö Лав в 17:29 09.07.2020

В разделе "Тема гижӧд" желательно сделать поиск по автору, по переводчику и по источнику. Сейчас только по названию произведения.

Дилектный словарь

опубликовал Öньö Лав в 13:44 09.07.2020

1. Заменить тильду "~" на содержимое <term></term>

2. Если внутри <ex></ex> есть запятая c предшествующей точкой ".," или закрывающей скобкой ")," , то эту запятую надо заменить на  </ex><ex>, а каждому примеру добавить один и тот же <ex_tr></ex_tr> , пример:
было

<ex>~ няня вв. (Мор.), ~ жытьник вв. (П.), ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>

будет

<ex>~ няня вв. (Мор.)</ex> <ex_tr>житница, амбар</ex_tr>

<ex> ~ жытьник вв. (П.)</ex> <ex_tr>житница, амбар</ex_tr>

<ex> ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>

3. Сформировать уровни <example> и <exam>

4. Все названия диалектов переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия диалектов

вв.
вс.
вым.
иж.
лл.
нв.
печ.
скр.
сс.
уд.


Если после этого названия есть текст в скобках, то он переносится вместе с названием диалекта.

5. Оставшиеся названия говоров переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия говоров

 

 

 

 

Краткий перечень дел до отпуска

опубликовал Öньö Лав в 19:32 03.07.2020

  • +Создание механизма загрузки корпусов
  • +Починка поиска по лемме в корпусе
  • +Починка загрузки в контекстном словаре
  • Оформление  разделов в рабочем интерфейсе интегрального словаря
  • Премещение названией диалектов в exam в диалектном словаре
  • +Переоформление тематических табличек второго плана в библиотеке
Косячок

опубликовал Öньö Лав в 18:43 25.06.2020

В прошлый раз не прокатило поднять ";". Теперь придется это сделать с новым условием. Все строки, начинающиеся с <ex> в которых нет последовательности </ex> <ex_tr> поднимаем без тэгов в предыдущую строку перед </t> или </ex_tr> (в зависимости от того, что там было в конце), отделив от предыдущего текста точкой с запятой ";".

 

Пример.

Сейчас:
<line>
    <term>алаа</term>
    <defn fut="">
        <mean dial="иж.">
            <t>толково</t>
                <ex>красиво</ex_tr>
                <ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
        </mean>
    </defn>
</line>

 

Надо:
<line>
    <term>алаа</term>
    <defn fut="">
        <mean dial="иж.">
            <t>толково; красиво</t>
                <ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
        </mean>
    </defn>
</line>

В диалектный словарь

опубликовал Öньö Лав в 18:18 22.06.2020

  1. +Все содержимое от <p> до тире "—" и пробела за ним перемещаем в вышестоящий <mean>, в качестве содержимого аттрибута dial="", при этом само тире с последующим пробелом удаляется.
  2. +Выявляем все строки, где более одного "—" . Комментим лишние "—" .
  3. Все строчки, содержащие <ex> и не содержащие тире "—", добавляем через точку с запятой "; " к предыдущей строке.
  4. +Во всех строках, начинающихся с <ex> меняем "—" на "</ex> <ex_tr>", а в конце строки добавляем "</ex_tr>".
  5. +Закрываем тегом </p> строки, начинающиеся с <p>.
  6. +Все содержимое <p>, начинающееся со фразы "то же, что ", переносим в вышестоящий <mean> в качестве содержимого аттрибута link="", при этом надо бы решить проблему типа "во 2 знач."
  7. +Приводим к верхнему регистру содержимое <term></term>.
  8. +Убрираем содержимое атрибута fut="" (сам атрибут оставляем).
По dict.fu-lab.ru

опубликовал Öньö Лав в 19:41 04.06.2020

  1. При выборе предпочитаемого языка поиска в списке словарей (как в левом, так и в выпадающем) должны остаться только словари, содержащие данный язык. +
  2. Добавить опцию поиска только по точному совпадению / все слова, содержащие данную комбинацию символов +
  3. Добавить опцию поиска только по леммам / по всему тексту словарей. +
  4. В случае посика по всеме тексту в список найденного помимо лемм выводить только строчки, содержашие искомое слово. +
Удаленка

опубликовал admin в 11:54 02.04.2020

1. Написан bash скрипт копирования аудио файлов в system_audio

Тест

опубликовал Öньö Лав в 10:26 21.03.2020

1999, 1.999 - работает

19796, 19 796, 19.796 - не работает

16 марта

опубликовал admin в 14:02 16.03.2020

1. Установка операционной системы на новый ПК Епимаховой Светлане (бухгалтерия)

2. Замена и настройка проектора в большом зале

3. Установка Малыгину Михаилу КриптоПро, настройка электронной подписи

12 марта

опубликовал admin в 8:49 13.03.2020

1. Техническое обеспечение работы синхронного перевода "Северного культурного форума"

Яндекс.Метрика