[Dict] БГ Офис модул за проверка на правопис

Sah War ve4ernik at gmail.com
Fri May 15 19:44:28 EEST 2015


@Стоян Димитров:

Има неправилно изписани, както и остарели названия. Повечето елементи са
> добавени като специални имена (клас 200), които не се членуват и от там се
> губи ефекта на присъствието им в речника. Т.е. има „алуминий“, но липсва
> „алуминият“.


Изпрати ми файл с тези остарели названия, за да ги видя и аз. Неправилно
изписаните (т.е. тези с обикновени правописни грешки) обаче непременно
трябва да се поправят.

Изглежда dd е IDI, т.е. dd е авторът на IDI spellchecker.

>> Забелязах само, че всички думи от този подтип са от м. р. и
> >> завършват на „-ий“ (има няколко с „-ей“ или „-ой“), което
> >> вероятно е и характеристиката, по която са включени в този
> >> подтип.
> > Този подтип е без множествено число и по мое усмотрение (за жалост
> > го карам по усмотрение) за елементите е удачен. Не се сещам за
> > практическо приложение на множествено число на „уран“, да речем,
> > или „водород“. Хм, въпреки че защо не…
> > Водородите (замества израза „водородните атоми“) в еди-кое-си
> > съединение са…
> > Какво мислиш?
> Абсурд.


Кое е абсурдното, Nick? Думите в този подтип изглежда наистина са сложени в
него поради наличието на описаните признаци на думите.

Колкото до това за включването на формите за мн. ч. на химическите елементи
— да, съгласен съм, че няма смисъл да се включват формите им за мн. ч.,
почти не се използват. Но членуваните им форми за ед. ч. (т.е. „нулевият“
(основната словоформа), краткият и пълният член — например: алуминий,
алуминия, алуминият) определено трябва да се включат. Трябва да се включат
и прилагателните, които образуват (например: алуминиев, алуминиевия,
алуминиевият, алуминиева, алуминиевата, алуминиево, алуминиевото,
алуминиеви, алуминиевите).

Аз съм съгласен да се вкара базата от данни от IDI Spellchecker (версия 2.54)
и да се използва нея вместо настоящите файлове със списъците с думите (но
без файловете с речниците!!!), но първо трябва да се направи копие на
всички настоящи файлове и да се сложи в отделна папка, например
pre-IDIspellchecker-db-import (за да има от какво да възстановим нещата,
ако прецакаме нещо при вкарването на файлове, пък и с архивни цели)...
Разбира се, г-н Радев трябва да се съгласи с тази промяна, за да пристъпим
към осъществяването ѝ.

Стояне, важно е обаче да попиташ автора на IDI Spellchecker дали е съгласен
неговите данни да се влеят в BGoffice, но под лицензите на BGoffice (иначе
би било лоша идея да се вкарва информацията от IDI Spellchecker).

Поздрави,
Sah War (sahwar)

На 14 май 2015 г., 14:01, Стоян Димитров <stoyan at gmx.com> написа:

>
>
> На 14.05.2015 г. в 06:22, Sah War написа:
>
> Здравей,
>
> Не знам кой е dd, може да е Борислав Манолов (той е създателят и
> администраторът на chitanka.info), а може да е и някой друг. Не знам и
> колко достоверни са данните, включени в посочения от теб подтип от речника
> на „Читанка“.
>
> Не съм чувал да са променили имената на химичните елементи в последните
> години (може би с изключение на някои от тези след 110, като 114 и 116?)...
> Поправи ме, ако греша. Забелязах само, че всички думи от този подтип са от
> м. р. и завършват на „-ий“ (има няколко с „-ей“ или „-ой“), което вероятно
> е и характеристиката, по която са включени в този подтип.
>
> Не съм сигурен и за правописа на геоложките епохи, част от които са
> включени в този подтип. Доколкото знам, на български имената на геоложките
> епохи май се пишат с начална малка буква, но на много места ги пишат и с
> начална главна... Не съм сигурен кой вариант е правилният, май е този с
> начална малка... На български всички химични елементи са с начална малка
> буква (освен ако не са в началото на изречение или не са използвани като
> названия на други неща, разбира се). Същото се отнася и за имената на
> месеците и на дните от седмицата на български. На английски обаче са с
> начална главна буква.
>
> П.П. Отново ще се повторя, за което се извинявам: трябва да разгледаме и
> файловете на IDI Spellchecker, защото в тази програма, както вече
> многократно споменахме, са добавени още подтипове и са променени някои от
> вече наличните. Самият аз мисля, че са пропуснати част от формите в
> словоформената парадигма на глаголите, и мисля, че ще е добре да добавим и
> тези пропуснати неща. Въобще, трябва да слеем нещата от BGoffice с тези от
> IDI Spellchecker, с промените и допълненията на г-н Балабанов, с моите
> допълнения и промени, и с твоите, Стояне (както и с тези на други хора, ако
> има такива). Но това е доста сложна дейност...
>
> Речено - сторено. Това е копие от писмото на автора на IDI
>
>   Здравей! По принцип бих се съгласил да се импортира цялата IDI база до
> версия 2.54 (последната свободна за теглене), като това изрично се посочи.
> И само ако остане единствено тя, без да се обединява механично с каквато и
> да е част от съществуващата словоформена база в БГ Офис, тъй като това на
> практика би я обединило с изчистените грешки и всичко, върху което съм
> работил през последните години, би се обезсмислило за потребителите на БГ
> Офис, а и би накълнило репутацията на IDI продукта.
>
>  Може да погледнеш темите за чекъра тук
> <http://forum.chitanka.info/topic1361.html> или тук
> <http://subs.sab.bz/forum/index.php?showtopic=9353>, както и да си свалиш
> последната безплатна версия тук
> <http://softvisia.com/download.php?view.1709> (кликаш Full версията от
> официалния сървър). Базите в пакета не са защитени, тъй че спокойно може да
> се разгледат с обикновен текстов редактор (файлът, който те интересува, е
> _D2_ungrouped_sorted.txt). Всеки програмист не би имал проблем да ги
> извлече. Ако си съгласен с горните две условия, действай. Но не се
> изкушавай да го правиш "полулегално", тъй като в самата база през годините
> съм слагал десетки котви (теоретично правилни, но несъществуващи думи), за
> да си я разпознавам, а и не виждам никакъв практически смисъл да го правиш.
>
>  Поздрави,
>  Иво
>
>  Малко ми е каша кой кого трябва да упомене, но това ще се изясни, надявам
> се.
>
>
> П.П.П.П. Към Михаил Балабанов и Радостин Раднев:
>
> Наскоро се сдобих с голям брой файлове с речници (повечето в текстов вид),
> но не знам каква е политиката ви по отношение на добавянето на такива
> файлове към BGoffice, защото част от речниците (за съжаление, става въпрос
> за по-голямата част...) са от комерсиални речници и не знам дали няма да ни
> осъдят, ако ги добавим към файловете на BGoffice... Ще се радвам, ако се
> изкажете по въпроса, за да знам дали да ги пусна в хранилището в
> SourceForge.
>
> Поздрави,
>  Sah War (sahwar)
>
> На 12 май 2015 г., 22:59, Стоян Димитров <stoyan at gmx.com> написа:
>
>>     Здравейте,
>>
>>     До колко мога да се доверя на Читанка по отношение на този подтип
>> [1]? Вторият ми въпрос е: кой е dd - авторът на този подтип? В момента
>> работя по осъвременяване на имената на химичните елементи, които в
>> по-голямата си част попадат точно там.
>>
>> [1] http://rechnik.chitanka.info/type/32b
>>
>> --
>>   С
>>
>> _______________________________________________
>> Dict mailing list
>> Dict at ludost.net
>> http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>>
>
>
>
> _______________________________________________
> Dict mailing listDict at ludost.nethttp://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>
>
> --
> С
>
>
> _______________________________________________
> Dict mailing list
> Dict at ludost.net
> http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.ludost.net/pipermail/dict/attachments/20150515/c39c0495/attachment-0001.html>


More information about the Dict mailing list