[prev in list] [next in list] [prev in thread] [next in thread]
List: dict-bg
Subject: Re: [Dict] =?utf-8?b?0JHQkyDQntGE0LjRgSDQvNC+0LTRg9C7INC30LAg0L/RgNC+?=
From: Radostin Radnev <radnev () gmail ! com>
Date: 2015-03-31 10:25:36
Message-ID: CALC7OmZR6PXXxdaCEN04ak=LWfi7MaaO84ExeTUXPgwJkDmg+A () mail ! gmail ! com
[Download RAW message or body]
[Attachment #2 (multipart/alternative)]
[Attachment #4 (text/plain)]
ÐдÑавейÑе,
Ðа ÑÑжаление, нÑмам Ñвободно вÑеме и ми е \
ÑÑÑдно да ÑÑаÑÑвам в нови пÑоекÑи.
ÐоиÑо е изпÑаÑил нÑкакви пÑомени кÑм ÐÐÐÑÐ¸Ñ \
ÑÑм ги вкаÑвал - но Ñе Ñа били доÑÑа малко. \
ÐÑÐ¾Ð¼ÐµÐ½Ñ Ð½Ð° лиÑензи, 1-2 ÑгÑеÑени Ñипа и пÑ. - \
неÑаÑа Ñа опиÑани в ChangeLog кое и какво е \
пÑоменÑно,
ÐаÑо ÑÑм запоÑвал пÑоекÑа ÑÑм Ñи поÑÑавил \
нÑколко ÑÑни, ÑоÑни и изпÑлними Ñели. ÐпиÑани \
Ñа вÑв Ñайла - design_objective.txt
"ÐлавнаÑа Ð¸Ð´ÐµÑ Ðµ да Ñе поÑÑигне леÑна и Ñдобна \
ÑÑÑÑкÑÑÑа за ÑÑÑ
Ñанение и добавÑне на нови \
данни. ÐÑ Ñази ÑÑÑÑкÑÑÑа Ñ Ð¿Ð¾Ð¼Ð¾ÑÑа на пÑогÑама \
да Ñе генеÑиÑÐ°Ñ ÑÑоÑвеÑниÑе ÑеÑниÑи или да Ñе \
ÑÑанÑÑоÑмиÑÐ°Ñ Ð´Ð°Ð½Ð½Ð¸Ñе в дÑÑг по-компакÑен \
вид."
Ð ÑÑм ÑпÑÑл до Ñам. Т.е. в моменÑа има ÑÑÑÑкÑÑÑа \
на данниÑе, коÑÑо може да Ñе ÑедакÑиÑа Ñ \
ÑекÑÑов ÑедакÑÐ¾Ñ Ð¸ има ÑкÑипÑове на езика Perl, Ñ \
ÑиÑÑо Ð¿Ð¾Ð¼Ð¾Ñ Ð¼Ð¾Ð¶Ðµ да пÑовеÑÑваÑе базаÑа \
(данниÑе), да генеÑиÑаÑе ÑеÑниÑи за пÑовеÑка на \
пÑавопиÑа за Ðозила, ÐÑиÑа, Ð¥Ñом и пÑ. и \
ÑÑоÑвеÑно леÑно може данниÑе да Ñе \
конвеÑÑиÑÐ°Ñ Ð´Ð¾ дÑÑги ÑоÑмаÑи (какÑо е видно \
има поне 3 клонинга). Ð Ñова е каÑо ÑÑло. Ðма \
едно демо за Ñазпознаване ÑаÑÑиÑе на ÑеÑÑа но \
ниÑо повеÑе и ÑÑм ÑпÑÑл до Ñам. Ð Ñова неÑо \
ÑабоÑи под ÐинÑÐºÑ (конзола, нÑма GUI).
РвÑиÑко запоÑва и Ñе базиÑа на Ñази книжка - \
ÐÑÑÑÑев Ð., ÐоÑÑÐ¾Ð»Ð¾Ð³Ð¸Ñ Ð½Ð° бÑлгаÑÑÐºÐ¸Ñ ÐµÐ·Ð¸Ðº в 187 \
Ñипови ÑаблиÑи. С., ÐÐ, 1984.
ÐÑ Ñам наÑаÑÑк ЧиÑанка, УикиÑеÑника - ги каÑÐ²Ð°Ñ \
неÑаÑа в Уеб, комбиниÑÐ°Ñ Ð³Ð¸ оÑделниÑе модÑли. Ð \
вÑиÑко Ñова е поÑ
вално.
IDI Spellchecker-а оÑива доÑÑа по-напÑед и пÑави доÑÑа \
нови неÑа, но за ÑÑжаление ниÑо не е вкаÑано \
обÑаÑно (поне по базаÑа) и ÑÑоÑвеÑно Ñова не \
допÑинаÑÑ Ð¿Ð¾ никакÑв наÑин за ÑазÑиÑение на \
ÑеÑниÑиÑе за пÑовеÑка на пÑавопиÑа за Ðозила, \
ÐÑиÑа и пÑ.
ÐоколкоÑо ÑазбиÑам има две идеи. ÐднаÑа е да Ñе \
напÑави неÑо ново и Ñ
Ð¸Ð¿ÐµÑ Ð¼ÐµÐ³Ð° Ñко - Словник. Ð \
дÑÑгаÑа Ð¸Ð´ÐµÑ Ðµ на г-н СÑоÑн ÐимиÑÑов, койÑо \
пÑоÑÑо иÑка да ÑазÑиÑи ÑеÑника на Ðозила.
РазÑиÑÑванеÑо на ÑеÑника на Ðозила е \
ÑÑавниÑелно леÑно поÑÑижима Ñел Ñ Ð½Ð°Ð»Ð¸ÑниÑе \
ÑÑедÑÑва - вÑе пак аз ÑÑм вкаÑал близо 65 000 дÑми \
по Ñози наÑин.
ÐамиÑÐ°Ñ Ñе дÑмиÑкиÑе, опÑÐµÐ´ÐµÐ»Ñ Ð¸Ð¼ Ñе Ñипа, \
вкаÑÐ²Ð°Ñ Ñе в ÑÑоÑвеÑниÑе Ñайлове
- има нÑкакви ÑкÑипÑове за авÑомаÑизиÑане на \
пÑоÑеÑа, но каÑо ÑÑло е ÑÑÑен пÑоÑеÑ.
След Ñова има ÑкÑипÑове за пÑовеÑка на \
ÑÑÑÑоÑниеÑо на базаÑа - дали дÑмиÑкиÑе Ñа \
вкаÑани в пÑавилниÑе Ñайлове, дали нÑма нÑÐºÐ¾Ñ \
лаÑинÑка бÑква вкаÑана (пÑимеÑно лаÑинÑко а) и \
оÑе нÑÐºÐ¾Ñ Ð¸ дÑÑга пÑовеÑка (забÑавил ÑÑм ги \
веÑе). Ð Ñлед Ñова Ñ Ð¿Ð¾Ð¼Ð¾ÑÑа на дÑÑг ÑкÑÐ¸Ñ Ñе \
генеÑиÑÐ°Ñ ÑеÑниÑиÑе за Ðозила, ÐÑиÑа и пÑ. - \
пÑоÑеÑÑÑ Ðµ изÑÑло авÑомаÑизиÑан.
Commit доÑÑÑп до SVN мога леÑно да ви дам. ÐÑоÑÑо Ñе \
ÑегиÑÑÑиÑайÑе http://sourceforge.net/ и ми пÑаÑеÑе \
поÑÑебиÑелÑкоÑо име.
ÐаÑо ÑÑло нÑма пÑавила за пÑеглед и пÑовеÑка. \
Ðо в ÑлÑÑай на нÑжда мога да погледна дали \
вÑиÑко е наÑед. Ðога да Ñ
вÑÑÐ»Ñ ÐµÐ´Ð½Ð¾ око на кода \
и да Ñи ÑÐ¿Ð¾Ð¼Ð½Ñ ÐºÐ°ÐºÐ²Ð¸ бÑÑ
а пÑоÑедÑÑиÑе. ÐолÑма \
ÑаÑÑ Ð¾Ñ ÑÑÑ
Ñа инÑÑиÑивни, ÑкÑипÑовеÑе Ñа Ñ \
говоÑÑÑи имена. ÐеÑоÑÑноÑÑÑа да Ñе обÑÑка неÑо \
е доÑÑа малка. Така Ñе нÑма пÑоблеми.
РмоменÑа каÑо гледам по логовеÑе има един \
колега, койÑо бÑÑника неÑо по \
английÑко-бÑлгаÑÑкаÑа база на ÑеÑника, но Ñова \
по никакÑв наÑин нÑма влиÑние вÑÑÑ
Ñ \
бÑлгаÑÑкаÑа база за пÑовеÑка на пÑавопиÑа.
РпÑоекÑа има ÑÑи диÑекÑоÑии:
1. docs - докÑменÑи, опиÑваÑи нÑкои неÑа - главно \
за мен да не ги забÑÐ°Ð²Ñ 2. data - данниÑе - \
ÑÑÑÑкÑÑÑаÑа е опиÑаÑелна и нÑма нÑжда да Ñе \
ÑÑдиÑе кое какво е. РнаÑалоÑо на вÑеки Ñайл \
има коменÑаÑи, ако неÑо ÑÑм измиÑлÑл извÑн \
книгаÑа - 187 Ñипа ;) 3. bin - ÑкÑипÑове за поддÑÑжка \
и генеÑиÑане на ÑеÑниÑи - ÑÑÑо е опиÑаÑелна и \
леÑно Ñе ÑазбиÑа кой ÑкÑÐ¸Ð¿Ñ ÐºÐ°ÐºÐ²Ð¾ пÑави.
ÐиÑÐ»Ñ Ñе ÑÑÑбваÑе да напÑавиÑе "export LANG=bg_BG.cp1251" \
и поÑле да пÑÑкаÑе ÑкÑипÑовеÑе - инаÑе Ñе \
полÑÑÐ°Ð²Ð°Ñ Ð»ÐµÐºÐ¾ ÑÑÑанни ÑезÑлÑаÑи. ТÑÑбва да е \
опиÑано в докÑменÑиÑе. ;)
Рнай-леÑÐ½Ð¸Ñ Ð½Ð°Ñин ÑпоÑед мен е да Ñе ÑабоÑи \
ÑÑвмеÑÑно Ñ Ð°Ð²ÑоÑа на IDI Spellchecker, за да Ñе види \
какво е пÑоменÑл и добавÑл Ñой и дали може неÑо \
Ð¾Ñ Ð½ÐµÐ³Ð¾ да Ñе изÑопли и да Ñе вкаÑа в базаÑа на \
ÐÐÐÑÐ¸Ñ Ð¸ ÑÑоÑвеÑно да Ñе генеÑиÑÐ°Ñ ÑеÑниÑиÑе \
за Ðозила, ÐÑиÑ, ....
ÐоздÑави,
2015-03-31 1:03 GMT+03:00 СÑоÑн ÐимиÑÑов <stoyan@gmx.com>:
>
>
> Ðа 30.03.2015 г. в 22:05, Sah War напиÑа:
>
> 1. Ðко знаеÑе как, Ñе Ñе Ñадвам да ÑÑздадеÑе .txt \
> ваÑÐ¸Ð°Ð½Ñ Ð½Ð° db.sql.gz (вÑе пак Ñова е SQL база Ð¾Ñ \
> данни...), даже е добÑе Ñози ваÑÐ¸Ð°Ð½Ñ Ð´Ð° Ñе \
> Ñаздели на нÑколко оÑделни .txt Ñайла, заÑоÑо \
> инаÑе Ñе е мÑка да Ñе ÑедакÑиÑа Ñ ÑекÑÑов \
> ÑедакÑоÑ.
> Това биÑ
могÑл ÑÑавниÑелно леÑно да го \
> напÑавÑ. ÐÑоÑÑо ÑÑÑбва да ÑÑоÑним
> деÑайлиÑе.
>
>
> 1. Ðми, ако пÑоÑÑо в оÑделниÑе .dat Ñайлове Ñа \
> Ñложени ÑазлиÑни дÑми ÑпоÑед ÑаÑÑÑа на ÑеÑÑа, \
> кÑм коÑÑо пÑинадлежаÑ, Ñо пÑоÑÑо Ñези Ñайлове \
> ÑÑÑбва да Ñе пÑеобÑазÑÐ²Ð°Ñ Ð² .txt (UTF-8). Ðз обаÑе \
> не знам ниÑо за ÑоÑмаÌÑа за бази Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸ SQL \
> оÑвен Ñова, Ñе ÑÑава вÑпÑÐ¾Ñ Ð·Ð° ÑелаÑионна \
> база Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸. Ðе знам как ÑакÑв Ñип Ñайл Ñе \
> пÑеобÑазÑва в .txt, заÑова и поÑÑÑÑиÑ
ваÑаÑа \
> помоÑ.
>
> ÐбÑÑнеÑе какви подÑобноÑÑи да обÑÑдим по \
> оÑноÑение на Ñази дейноÑÑ, за да Ñе ÑазбеÑем \
> по вÑпÑоÑа.
> Ðко иÑкаÑе ÑÑÑÑкÑÑÑа каÑо Ñази в папкаÑа data \
> Ñе ÑÑане, но ÑайловеÑе Ñе бÑÐ´Ð°Ñ Ð±ÐµÐ· Ð·Ð°Ð³Ð»Ð°Ð²Ð½Ð¸Ñ \
> коменÑаÑ, какÑо е в изÑ
одниÑе Ñайлове Ð¾Ñ \
> Ñ
ÑанилиÑеÑо, вÑиÑко оÑÑанало е поÑÑижимо. \
> УÑÑе веÑÐµÑ Ñе напиÑа ÑкÑипÑа, Ñе веÑе е никое \
> вÑеме.
> Това е непоÑилен и безмиÑлен ÑÑÑд. Ðа \
> набиÑанеÑо на Ñози ÑеÑник едва ли е
> използвана пиÑеÑа маÑина. Ðо кой знаеâ¦
>
>
> 2. ÐиÑеÑа маÑина?!? Ðой оÑе използва Ñакива? \
> Това е ÑеÑник Ð¾Ñ 2012 г., веÑоÑÑно е напÑавен на \
> Adobe InDesign, ÑканиÑан е каÑо ÑеÑно-бÑл (оÑвен \
> пÑеднаÑа и заднаÑа коÑиÑа). Ð Ñе Ñази ÑабоÑа \
> Ñе оÑнеме много вÑеме, е пÑеделно ÑÑно.
>
> Ðо колкоÑо имам Ñпомени в ÑаблиÑаÑа на Ñникод \
> нÑма знак за ÑдаÑено Ñ.
> ÐÑÑгиÑе знаÑи ги има, наиÑÑина не Ñа в \
> киÑилÑкаÑа ÑаÑÑ Ð½Ð° ÑаблиÑаÑа, но поне ги има, \
> Ñака Ñе каÑо ваÑÐ¸Ð°Ð½Ñ Ð¾ÑÑава композиÑанеÑо.
>
>
> 3. ТÑÑбва да гледаÑе Ñамо блока \
> âCyrillic<http://www.babelstone.co.uk/Unicode/babelmap.html> \
> <http://www.babelstone.co.uk/Unicode/babelmap.html>" (киÑилиÑа) в \
> Уникод; омогÑаÑиÑе в лаÑинÑкиÑе блокове на \
> Уникод, коиÑо Ñа визÑално иденÑиÑни Ñ \
> киÑилÑки знаÑи (Ñ ÑдаÑениÑ), липÑваÑи в \
> киÑилÑÐºÐ¸Ñ Ð±Ð»Ð¾Ðº, не бива да Ñе Ð¸Ð·Ð¿Ð¾Ð»Ð·Ð²Ð°Ñ Ð² \
> киÑилÑки ÑекÑÑ, Ñе не Ð¸Ð·Ð»Ð¸Ð·Ð°Ñ Ð¿Ñи ÑÑÑÑенеÑо Ñ \
> Ctrl + F, заÑоÑо Ð¸Ð¼Ð°Ñ Ð¾Ñделни заделени кодове в \
> Уникод. РкиÑилÑÐºÐ¸Ñ Ð±Ð»Ð¾Ðº има Ñамо знака âÑ", \
> койÑо Ñе използва в бÑлгаÑÑÐºÐ¸Ñ ÐµÐ·Ð¸Ðº (а може би \
> и в македонÑкиÑ?), има и âе", но Ñ âобÑаÑно" \
> ÑдаÑение, коеÑо май не Ñе ползва в бÑлгаÑÑÐºÐ¸Ñ \
> език (в наÑÐ¸Ñ ÑдаÑениеÑо изглежда каÑо Ñмален \
> вид на â\" над Ð´Ð°Ð´ÐµÐ½Ð¸Ñ Ð·Ð½Ð°Ðº).
> âÐомпозиÑанеÑо" по Уникод е най-ÑдаÑниÑÑ \
> ваÑÐ¸Ð°Ð½Ñ ÑпоÑед мен, веÑе обÑÑниÑ
пÑиÑиниÑе, \
> поÑади коиÑо ÑÑм на Ñова мнение (накÑаÑко: \
> ÑÑез ÑникодÑко композиÑане за добавÑне на \
> ÑдаÑÐµÐ½Ð¸Ñ Ð¿Ñи ÑÑÑÑене Ñ Ctrl + F Ñе оÑкÑива какÑо \
> ÑÑÑÐ¸Ñ Ð½Ð¸Ð· Ñ ÑдаÑениÑÑа, Ñака и ÑÑÑÐ¸Ñ Ð½Ð¸Ð· без \
> ÑдаÑениÑÑа, коеÑо е огÑомно ÑдобÑÑво).
>
> Ðда, Ñова е HTML-ÑкиÑÑ Ð°Ð½Ð°Ð»Ð¾Ð³ на ÑникодÑкоÑо \
> композиÑане на знаÑи. Раз
> не ÑмÑÑам, Ñе Ñо е подÑ
одÑÑо за ÑелÑа.
>
> Ðа, да, много пÑавилно. Ðе Ñе бÑÑ
замиÑлÑл за \
> ÑÑÑÑенеÑо, но не ми Ñе ÑÑÑÑва, Ñе Ñе ÑабоÑи \
> какÑо ÑÑÑбва. ÐÑе пак ÑÑава дÑма за знак, бил \
> Ñой и невидим, Ð¼ÐµÐ¶Ð´Ñ Ð²Ð¸Ð´Ð¸Ð¼Ð¸Ñе знаÑи. Ðо Ñова е \
> вÑпÑÐ¾Ñ Ð½Ð° ÑеализаÑÐ¸Ñ Ð½Ð° ÑÑÑÑеÑÐ¸Ñ Ð°Ð»Ð³Ð¾ÑиÑÑм.
>
> 4. Ðа пÑÑв пÑÑ ÑÑвам, Ñе в HTML има оÑделно \
> композиÑане (ÑмеÑване на знаÑи) Ð¾Ñ Ñова на \
> Уникод (знам Ñамо за HTML entities), кÑде го има \
> опиÑано Ñова в ÐнÑеÑнеÑ?!?
>
> Ðне, гÑеÑал ÑÑм. ЧиÑанкаÑа е използвала неÑо \
> дÑÑго. ÐнаÑе да, HTML-ÑкоÑо комбиниÑане Ñи е \
> ÑникодÑкоÑо, но Ñе Ð¸Ð·Ð¿Ð¾Ð»Ð·Ð²Ð°Ñ Ð²Ð¸Ð´Ð¸Ð¼Ð¸Ñе entities [1]. \
> ÐолкоÑо до ÑÑиÑкопÑенаÑÑнеÑо â Ñо е ÑÑÑдно и \
> за да е ÑоÑно (а не пÑоÑÑо
> генеÑиÑано по алгоÑиÑÑм, койÑо ÑеÑÑо дава \
> напÑлно гÑеÑни ваÑианÑи за ÑÑиÑкопÑенаÑÑне), \
> Ñо ÑÑÑбва да Ñе напÑави каÑо ÑÑÑно напиÑан \
> ÑпиÑÑк ÑÑÑ ÑÑиÑкиÑе на дÑмиÑе.
>
>
> 5. Ðма и дÑÑг пÑоблем, койÑо оÑÑзнаÑ
едва Ñега. \
> ТÑÑбва да Ñе използва пÑавилниÑÑ Ð·Ð½Ð°Ðº за \
> оÑделÑне на ÑÑиÑки (койÑо е ââ§" (U+2027, HYPHENATION \
> POINT), но в пÑакÑикаÑа Ñе използва пÑедимно \
> деÑиÑÑÑ â-" â но Ñова пÑави пÑоблеми, заÑоÑо \
> поÑледноÑо може да Ñе ÑÑеÑе за полÑÑлÑÑ \
> пÑавопиÑ, а е за ÑÑиÑкопÑенаÑÑне ÑÑез \
> деÑиÑ...). Ðо да Ñе вÑÑна кÑм пÑоблема, за койÑо \
> ÑÑÑ
да кажа â ÑÑÑбва да има дÑмаÑа, дадена без \
> ÑазделÑне на ÑÑиÑки и поÑле (на ÑÑÑÐ¸Ñ Ñед) \
> пÑилежаÑиÑе Ñ ÑÑиÑки, инаÑе може да Ñе окаже, \
> Ñе ÑÑиÑкопÑенаÑÑнеÑо дава гÑеÑни ваÑианÑи за \
> ÑÑиÑкопÑенаÑÑне пÑи ÑÑвпадане на ÑаÑÑи Ð¾Ñ \
> дÑми оÑкÑм бÑкви, коеÑо каÑа ÑиÑÑемаÑа да Ñи \
> миÑли, Ñе ÑÑиÑкоделенеÑо е по даден наÑин, а \
> Ñой вÑÑÑноÑÑ Ðµ непÑавилен... Сложна ÑабоÑа... :\ \
> ÐÑк и ÑÑÑбва ÑÑÑно да Ñе вÑÐ²ÐµÐ´Ð°Ñ ÑÑиÑкиÑе на \
> дÑмиÑе...
> РазбÑаÑ
ви напÑлно. Ð Ñега оÑÐµÐ²Ð¸Ð´Ð½Ð¸Ñ Ð²ÑпÑоÑ, \
> на койÑо оÑговоÑÑÑ
> веÑоÑÑно е иÑÑеÑиÑен ÑмÑÑ
, но нÑкой ÑвÑÑзвал \
> ли Ñе е Ñ Ñ
оÑаÑа Ð¾Ñ ÐÐÐ, за евенÑÑално \
> подпомагане на пÑоекÑа? Ðило Ñо Ñ Ð¸Ð·Ñ
одниÑе \
> кодове на ÑеÑника или по дÑÑг наÑин?
>
>
> 6. Ðемалка ÑаÑÑ Ð¾Ñ Ñези Ð¾Ñ ÐÐРпÑи ÐÐРживеÑÑ Ð² \
> епоÑ
аÑа на 1990-Ñе и оÑе не Ñа Ñи опÑавили \
> жалкоÑо онлайн подобие на многоÑÐ¾Ð¼Ð½Ð¸Ñ Ñи \
> ÑеÑник (http://ibl.bas.bg/rbe/, едва ÐоÑиÑлав Ðанолов Ð¾Ñ \
> âЧиÑанка" го напÑави по-ползваем ÑÑез \
> Ð½ÐµÐ³Ð¾Ð²Ð¸Ñ frontend на ÑеÑника им: http://rbe.chitanka.info), не \
> можем да оÑакваме Ñеална Ð¿Ð¾Ð¼Ð¾Ñ Ð¾Ñ ÑÑÑ
, \
> вÑпÑеки Ñе можем да Ñе пÑобваме поне да ги \
> помолим да ни пÑедоÑÑавÑÑ Ð±Ð°Ð·Ð°Ñа Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸ на \
> ÑеÑника Ñи, но по-ÑкоÑо ми Ñе ÑÑÑÑва, Ñе Ñе Ñе \
> заинаÑÑÑ Ð¸ Ñе Ñи дÑÑÐ¶Ð°Ñ Ð½Ð° âавÑоÑÑкоÑо пÑаво" \
> над базаÑа Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸...
> ÐÑ
Ñм, мÑÑ
Ñм, номеÑÑÑ Ñ Ð°Ð²ÑоÑÑкоÑо пÑаво, \
> еÑÑеÑÑвено.
> 7. Само Ñези Ð¾Ñ Ð¡ÐµÐºÑиÑÑа по компÑÑÑÑна \
> лингвиÑÑика кÑм ÐÐÐ Ñа напÑед Ñ Ð¼Ð°ÑеÑиала \
> (http://dcl.bas.bg/programs_bg.html,http://dcl.bas.bg/resources_bg.html и \
> оÑобеноhttp://dcl.bas.bg/dictionaries_bg.html) и Ñамо на ÑÑÑ
\
> вÑзлагам надежди. Те Ð¸Ð¼Ð°Ñ Ð¿ÑбликÑвани \
> Ñвободни данни, каÑо ÑеÑÑоÑен ÑеÑник, \
> генеÑиÑан Ð¾Ñ ÐºÐ¾ÑпÑÑ, коиÑо Ð¼Ð¾Ð³Ð°Ñ ÐµÐ²ÐµÐ½ÑÑално \
> да Ñе вгÑадÑÑ Ð² ÑеÑниковаÑа база на âÐÐ ÐÑиÑ", \
> но и за ÑÑÑ
не е ÑÑно дали Ñа пÑовеÑени Ð¾Ñ \
> Ñовек за пÑавопиÑни гÑеÑки и дали Ñе Ñе \
> ÑÑглаÑÑÑ Ð´Ð° ни Ð´Ð°Ð´Ð°Ñ Ð±Ð°Ð·Ð¸Ñе Ñи Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸ на \
> ÑеÑниÑиÑе Ñи, коеÑо де ÑакÑо ознаÑава да ги \
> пÑÑÐ½Ð°Ñ Ð¿Ð¾Ð´ Ñвободен лиÑенз...
> Ðе ÑмÑÑам, Ñе е Ð»Ð¾Ñ Ð²Ð°ÑÐ¸Ð°Ð½Ñ Ð´Ð° Ñе Ñмени \
> пÑÑвоизÑоÑника и за оÑнова да Ñе
> използва неÑо по-оÑÑвÑеменено, не ÑазбиÑам \
> идеÑÑа да има нÑколко еднакви наÑÐ¸Ð½Ð°Ð½Ð¸Ñ Ð·Ð° \
> едно и ÑÑÑо неÑо и ниÑо едно Ð¾Ñ ÑÑÑ
да не вÑÑÑа \
> обÑаÑно за поÑÑигане на ÑелÑа на \
> пÑÑвоизÑоÑника â по-добÑÑ ÐÐ ÐÑиÑ.
>
>
> 8. Реално нÑма Ñак Ñолкова много ÑеÑниÑи Ñо Ñе \
> оÑнаÑÑ Ð´Ð¾ spellchecker-и за бÑлгаÑÑÐºÐ¸Ñ ÐµÐ·Ð¸Ðº, оÑвен \
> оÑиÑиалнаÑа добавка за Firefox, наÑеÑена \
> âÐÑовеÑка на \
> пÑавопиÑа<https://addons.mozilla.org/en-US/firefox/addon/bulgarian-dictionary/> \
> <https://addons.mozilla.org/en-US/firefox/addon/bulgarian-dictionary/>" \
> (използва myspell, може би е оÑнована ÑеÑник Ð¾Ñ \
> âÐÐ ÐÑиÑ"?), има Ñамо добавкиÑе âBulgarian+English \
> Dictionary", âBulgarian+German Dictionary" и добавка ÑÑÑ ÑÑаÑÐ¸Ñ \
> иванÑевÑки пÑавопиÑ, койÑо не е акÑÑален. \
> Само пÑи онлайн ÑеÑниÑиÑе на бÑлгаÑÑÐºÐ¸Ñ ÐµÐ·Ð¸Ðº \
> има по-голÑмо ÑазнообÑазие, заÑоÑо ниÑаÑа оÑе \
> не е доминиÑана Ð¾Ñ Ð¿Ð¾-Ñложно ÑÑÑÑоен Ñвободен \
> онлайн ÑеÑник (какÑвÑо Ñе бÑде наÑиÑÑ Ð¿ÑÐ¾ÐµÐºÑ \
> âСловник"), Ñамо rechnik.info,onlinerechnik.com, eurodict.com и \
> rechnik.chitanka.info Ñе Ð¸Ð·Ð¿Ð¾Ð»Ð·Ð²Ð°Ñ Ñеално, дÑÑгиÑе Ñа Ñ \
> много огÑаниÑена ÑпоÑÑеба. Ðмам дÑлÑг ÑпиÑÑк \
> Ñ Ñакива бÑлгаÑÑки онлайн ÑеÑниÑи â ако \
> иÑкаÑе, Ñе ви го изпÑаÑÑ.
> ÐобавкаÑа използва ÑоÑмаÑиÑан .aff Ð¾Ñ ÐÐо. ÐмаÑ
\
> пÑедвид главно âIDI Spell Checker" и ÑеÑникÑÑ Ð½Ð° \
> ЧиÑанка. ЧиÑанкаÑа Ñ Ð¾Ð±ÑÑдиÑ
ме каÑо \
> ненадежден изÑоÑник.
>
> Склонен ÑÑм да използвам ÑекÑÑова база Ð¾Ñ \
> данни ÑÑига Ñова да има
> нÑкакÑв ÑезÑлÑаÑ, вÑпÑеки налиÑиеÑо на \
> ÑÑÑÑкÑÑÑиÑани данни Ð¾Ñ Ð±Ð°Ð·Ð°Ñа на âЧиÑанка" \
> (коиÑо по обекÑивни пÑиÑини Ñа неизползваеми \
> за ÑелÑа).
>
> 9. ÐÑоÑÑо нÑма дÑÑг ваÑÐ¸Ð°Ð½Ñ Ð² ÑлÑÑаÑ, оÑвен \
> използванеÑо на ÑекÑÑова база Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸ â вÑе \
> пак âÐÐ ÐÑиÑ" използва aspell и ispell (не знам дали \
> използва hunspell, myspell и/или enchant), коиÑо \
> доколкоÑо знам ÑабоÑÑÑ Ñамо Ñ ÑекÑÑови \
> Ñайлове. ÐопÑавеÑе ме, ако гÑеÑа.
> Ðмии, има дÑÑги ваÑианÑи. Ðдна ÑеализаÑÐ¸Ñ Ðµ \
> именно ÑеÑникÑÑ Ð½Ð° ЧиÑанка. СÑÑÑкÑÑÑаÑа на \
> базаÑа е добÑа. ÐеÑе неÑаÑа опиÑÐ°Ñ Ð´Ð¾ Ð½Ð°Ð±Ð¾Ñ Ð¾Ñ \
> инÑÑÑÑменÑи, Ñ ÐºÐ¾Ð¸Ñо Ñе боÑави Ñ Ñези данни. \
> Ðали Ñе Ñе Ð¸Ð·Ð²ÐµÐ¶Ð´Ð°Ñ Ð² ÑекÑÑови Ñайлове или \
> данниÑе Ñе Ñе обÑабоÑÐ²Ð°Ñ Ð¿Ð¾ дÑÑг наÑин е без \
> знаÑение. ÐÑÑинаÑа е, Ñе в моменÑа мигÑиÑане \
> кÑм база Ð¾Ñ Ð´Ð°Ð½Ð½Ð¸ нÑма да допÑинеÑе Ñ Ð½Ð¸Ñо, а \
> напÑоÑив. ÐнÑÑаÑÑÑÑкÑÑÑаÑа (ÑкÑипÑовеÑе \
> генеÑиÑаÑи ÑазлиÑниÑе неÑа) на пÑоекÑа \
> оÑевидно ÑабоÑи в Ñози Ñ Ð²Ð¸Ð´.
> 10. Сега видÑÑ
Ð¾Ñ \
> https://svn.code.sf.net/p/bgoffice/code/trunk/bgoffice/, Ñе .dat \
> ÑайловеÑе на âÐÐ ÐÑиÑ" Ñа вÑÑÑноÑÑ \
> обикновени ÑекÑÑови Ñайлове, а аз Ñи миÑлеÑ
, \
> Ñе Ñа двоиÑни Ñайлове... Ðо вÑиÑки Ñайлове Ñа в \
> Windows-1251, ÑÑÑбва да Ñе конвеÑÑиÑÐ°Ñ Ð´Ð¾ UTF-8.
>
> ÐоÑподин Раднев, ÑмÑÑам, Ñе Ñе ÑÑглаÑи Ñ Ñова \
> ÑвÑÑдение. Ðз ÑÑÑо ÑÑм ÑвÑÑдо âза".
>
> 11. ÐиÑлÑ, Ñе на пÑÑво вÑеме е най-добÑе г-н Ð \
> аднев или вие, г-н ÐимиÑÑов, да напÑавиÑе \
> копие на вÑиÑко Ð¾Ñ âÐÐ ÐÑиÑ" (в SourceForge) в GitHub и \
> да Ñи ÑÑÑÑÑдниÑим по пÑоекÑа Ñам, заÑоÑо \
> пÑоÑÑо не ÑазбиÑам ниÑо Ð¾Ñ SVN. :D ÐоÑле не би \
> било пÑоблем да копиÑаме новиÑе Ð¸Ð·Ð´Ð°Ð½Ð¸Ñ Ð¾Ñ \
> GitHub каÑо нови веÑÑии в SVN-Ñо на Ñ
оÑÑигна на \
> âÐÐ ÐÑиÑ" в SourceForge.
> ТоÑно Ñова иÑкам да избегна. ÐоÑедноÑо копие \
> на âÐÐ ÐÑиÑ". ÐаиÑÑина ÑазликаÑа е, Ñе Ñо Ñе е \
> обÑодоÑÑÑпно, но вÑе пак е копие. ÐÑ Ð´ÑÑга \
> ÑÑÑана каÑо за ÑабоÑа Ð¾Ñ Ð¿Ð¾Ð²ÐµÑе Ñ
оÑа GitHub е \
> по-добÑиÑÑ Ð²Ð°ÑианÑ, неÑÑмнено. ÐÑе пак Ñова е \
> ÑелÑа мÑ. ÐоÑподин Раднев, какво е ваÑеÑо \
> мнение? ÐÑ Ð´ÑÑга ÑÑÑана, какви Ñа кÑиÑеÑииÑе \
> за полÑÑаване на commit пÑава вÑÑÑ
Ñ Ñ
ÑанилиÑеÑо \
> или ÑаÑÑи Ð¾Ñ Ð½ÐµÐ³Ð¾? Ðак ÑÑава пÑеглежданеÑо и \
> пÑиеманеÑо/оÑÑ
вÑÑлÑнеÑо на пÑомени пÑавени \
> Ð¾Ñ Ð´ÑÑги?
> Ð.Ð. ÐÑ
, пиÑмоÑо ми пак ÑÑана пÑекалено дÑлго. \
> :D Ðай Ñе забÑавиÑе за какво ÑÑм пиÑал докаÑо \
> ÑеÑеÑе, заÑова номеÑиÑаÑ
абзаÑиÑе, за да ви е \
> е по-леÑно да ги ÑиÑиÑаÑе и да ги обÑÑдим. :)
>
> ÐоздÑави,
> Sah War (sahwar)
>
>
>
> _______________________________________________
> Dict mailing listDict@ludost.nethttp://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>
> [1] http://eenk.com/postavyane-na-udareniya-na-kirilitsa-s-html
>
> --
> С
>
>
> _______________________________________________
> Dict mailing list
> Dict@ludost.net
> http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
>
>
[Attachment #5 (text/html)]
<div dir="ltr">Здравейте,<div><br></div><div>За съжаление, нямам свободно време и ми \
е трудно да участвам в нови проекти.</div><div><br></div><div>Които е изпратил \
някакви промени към БГОфис съм ги вкарвал - но те са били доста малко. Променя на \
лицензи, 1-2 сгрешени типа и пр. - нещата са описани в ChangeLog кое и какво е \
променяно,</div><div><br></div><div>Като съм започвал проекта съм си поставил няколко \
ясни, точни и изпълними цели. Описани са във файла - \
design_objective.txt<br></div><div><br></div><div><div>"Главната идея е да се \
постигне лесна и удобна структура за</div><div>съхранение и добавяне на нови данни. \
От тази структура с помощта</div><div>на програма да се генерират съответните речници \
или да се</div><div>трансформират данните в друг по-компактен \
вид."</div><div><br></div></div><div><div>И съм спрял до там. Т.е. в момента има \
структура на данните, която може да се редактира с текстов редактор и има скриптове \
на езика Perl, с чиято помощ може да проверявате базата (данните), да генерирате \
речници за проверка на правописа за Мозила, Офиса, Хром и пр. и съответно лесно може \
данните да се конвертират до други формати (както е видно има поне 3 клонинга). И \
това е като цяло. Има едно демо за разпознаване частите на речта но нищо повече и съм \
спрял до там. И това нещо работи под Линукс (конзола, няма \
GUI).<br></div></div><div><br></div><div><div>А всичко започва и се базира на тази \
книжка - Кръстев Б., Морфология на българския език в 187 типови таблици. С., НИ, \
1984.</div></div><div><br></div><div>От там нататък Читанка, Уикиречника - ги качват \
нещата в Уеб, комбинират ги отделните модули. И всичко това е \
похвално.</div><div><br></div><div>IDI Spellchecker-а отива доста по-напред и прави \
доста нови неща, но за съжаление нищо не е вкарано обратно (поне по базата) и \
съответно това не допринася по никакъв начин за разширение на речниците за проверка \
на правописа за Мозила, Офиса и пр.</div><div><br></div><div><br></div><div>Доколкото \
разбирам има две идеи. Едната е да се направи нещо ново и хипер мега яко - Словник. А \
другата идея е на г-н Стоян Димитров, който просто иска да разшири речника на \
Мозила.</div><div><br></div><div><br></div><div>Разширяването на речника на Мозила е \
сравнително лесно постижима цел с наличните средства - все пак аз съм вкарал близо 65 \
000 думи по този начин.</div><div><br></div><div>Намират се думичките, определя им се \
типа, вкарват се в съответните файлове - има някакви скриптове за автоматизиране на \
процеса, но като цяло е ръчен процес.</div><div><br></div><div>След това има \
скриптове за проверка на състоянието на базата - дали думичките са вкарани в \
правилните файлове, дали няма някоя латинска буква вкарана (примерно латинско а) и \
още някоя и друга проверка (забравил съм ги вече). И след това с помощта на друг \
скрит се генерират речниците за Мозила, Офиса и пр. - процесът е изцяло \
автоматизиран.</div><div><br></div><div><br></div><div><br></div><div>Commit достъп \
до SVN мога лесно да ви дам. Просто се регистрирайте <a \
href="http://sourceforge.net/">http://sourceforge.net/</a> и ми пратете \
потребителското име.</div><div><br></div><div>Като цяло няма правила за преглед и \
проверка. Но в случай на нужда мога да погледна дали всичко е наред. Мога да хвърля \
едно око на кода и да си спомня какви бяха процедурите. Голяма част от тях са \
интуитивни, скриптовете са с говорящи имена. Вероятността да се обърка нещо е доста \
малка. Така че няма проблеми.</div><div><br></div><div>В момента като гледам по \
логовете има един колега, който бърника нещо по английско-българската база на \
речника, но това по никакъв начин няма влияние върху българската база за проверка на \
правописа.</div><div><br></div><div>В проекта има три \
директории:</div><div><br></div><div>1. docs - документи, описващи някои неща - \
главно за мен да не ги забравя</div><div>2. data - данните - структурата е описателна \
и няма нужда да се чудите кое какво е. В началото на всеки файл има коментари, ако \
нещо съм измислял извън книгата - 187 типа ;)</div><div>3. bin - скриптове за \
поддръжка и генериране на речници - също е описателна и лесно се разбира кой скрипт \
какво прави.</div><div><br></div><div>Мисля че трябваше да направите "export \
LANG=bg_BG.cp1251" и после да пускате скриптовете - иначе се получават леко \
странни резултати. Трябва да е описано в документите. \
;)</div><div><br></div><div><br></div><div>И най-лесния начин според мен е да се \
работи съвместно с автора на IDI Spellchecker, за да се види какво е променял и \
добавял той и дали може нещо от него да се изчопли и да се вкара в базата на БГОфис и \
съответно да се генерират речниците за Мозила, Офис, \
....</div><div><br></div><div><br></div><div>Поздрави,</div><div><br></div><div><br></div><div \
class="gmail_extra"><br><div class="gmail_quote">2015-03-31 1:03 GMT+03:00 Стоян \
Димитров <span dir="ltr"><<a href="mailto:stoyan@gmx.com" \
target="_blank">stoyan@gmx.com</a>></span>:<br><blockquote class="gmail_quote" \
style="margin:0px 0px 0px \
0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div bgcolor="#FFFFFF" text="#000000"><span class="">
<br>
<br>
<div>На 30.03.2015 г. в 22:05, Sah War
написа:<br>
</div>
<blockquote type="cite">
<pre>1. Ако знаете как, ще се радвам да създадете .txt вариант на db.sql.gz \
(все пак това е SQL база от данни...), даже е добре този вариант да се раздели
на няколко отделни .txt файла, защото иначе ще е мъка да се редактира с
текстов редактор.
Това бих могъл сравнително лесно да го направя. Просто трябва да уточним
</pre>
<blockquote type="cite">
<pre>детайлите.
</pre>
</blockquote>
<pre>1. Ами, ако просто в отделните .dat файлове са сложени различни думи \
според частта на речта, към която принадлежат, то просто тези файлове трябва да се
преобразуват в .txt (UTF-8). Аз обаче не знам нищо за форма̀та за бази от
данни SQL освен това, че става въпрос за релационна база от данни. Не знам
как такъв тип файл се преобразува в .txt, затова и потърсих вашата помощ.
Обяснете какви подробности да обсъдим по отношение на тази дейност, за да
се разберем по въпроса.</pre>
</blockquote></span>
Ако искате структура като тази в папката data ще стане, но файловете
ще бъдат без заглавния коментар, както е в изходните файлове от
хранилището, всичко останало е постижимо. Утре вечер ще напиша
скрипта, че вече е никое време.<br>
<br>
<blockquote type="cite"><span class="">
<pre>Това е непосилен и безмислен труд. За набирането на този речник едва ли е
</pre>
<blockquote type="cite">
<pre>използвана пишеща машина. Но кой знае…
</pre>
</blockquote>
<pre>2. Пишеща машина?!? Кой още използва такива? Това е речник от 2012 г.,
вероятно е направен на Adobe InDesign, сканиран е като черно-бял (освен
предната и задната корица). А че тази работа ще отнеме много време, е
пределно ясно.
До колкото имам спомени в таблицата на уникод няма знак за ударено ъ.
</pre>
<blockquote type="cite">
<pre>Другите знаци ги има, наистина не са в кирилската част на таблицата, но
поне ги има, така че като вариант остава композирането.
</pre>
</blockquote>
</span><pre><span class="">
3. Трябва да гледате само блока „Cyrillic
</span><a href="http://www.babelstone.co.uk/Unicode/babelmap.html" \
target="_blank"><http://www.babelstone.co.uk/Unicode/babelmap.html></a>“ \
(кирилица) в Уникод; омографите в латинските блокове на Уникод, които са визуално \
идентични с кирилски знаци (с ударения), липсващи в кирилския блок, не бива да се
използват в кирилски текст, те не излизат при търсенето с Ctrl + F, защото
имат отделни заделени кодове в Уникод. В кирилския блок има само знака „ѝ“,
който се използва в българския език (а може би и в македонския?), има и
„е“, но с „обратно“ ударение, което май не се ползва в българския език (в
нашия ударението изглежда като умален вид на „\“ над дадения знак).
„Композирането“ по Уникод е най-удачният вариант според мен, вече обясних
причините, поради които съм на това мнение (накратко: чрез уникодско
композиране за добавяне на ударения при търсене с Ctrl + F се открива както
същия низ с ударенията, така и същия низ без ударенията, което е огромно
удобство).
Мда, това е HTML-ският аналог на уникодското композиране на знаци. И аз
</pre><span class="">
<blockquote type="cite">
<pre>не смятам, че то е подходящо за целта.
</pre>
</blockquote>
</span></blockquote>
Да, да, много правилно. Не се бях замислял за търсенето, но не ми се
струва, че ще работи както трябва. Все пак става дума за знак, бил
той и невидим, между видимите знаци. Но това е въпрос на реализация
на търсещия алгоритъм.<span class=""><br>
<blockquote type="cite">
<pre>4. За пръв път чувам, че в HTML има отделно композиране (смесване на \
знаци) от това на Уникод (знам само за HTML entities), къде го има описано това в
Интернет?!?</pre>
</blockquote></span>
Мне, грешал съм. Читанката е използвала нещо друго. Иначе да,
HTML-ското комбиниране си е уникодското, но се използват видимите
entities [1].<div><div class="h5"><br>
<blockquote type="cite">
<pre>Колкото до сричкопренасянето — то е трудно и за да е точно (а не просто
</pre>
<blockquote type="cite">
<pre>генерирано по алгоритъм, който често дава напълно грешни варианти за
сричкопренасяне), то трябва да се направи като ръчно написан списък със
сричките на думите.
</pre>
</blockquote>
<pre>5. Има и друг проблем, който осъзнах едва сега. Трябва да се използва
правилният знак за отделяне на срички (който е „‧“ (U+2027, HYPHENATION
POINT), но в практиката се използва предимно дефисът „-“ — но това прави
проблеми, защото последното може да се счете за полуслят правопис, а е за
сричкопренасяне чрез дефис...). Но да се върна към проблема, за който щях
да кажа — трябва да има думата, дадена без разделяне на срички и после (на
същия ред) прилежащите ѝ срички, иначе може да се окаже, че
сричкопренасянето дава грешни варианти за сричкопренасяне при съвпадане на
части от думи откъм букви, което кара системата да си мисли, че
сричкоделенето е по даден начин, а той всъщност е неправилен... Сложна
работа... :\ Пък и трябва ръчно да се въведат сричките на думите...
Разбрах ви напълно. А сега очевидния въпрос, на който отговорът
</pre>
<blockquote type="cite">
<pre>вероятно е истеричен смях, но някой свързвал ли се е с хората от БАН, за
евентуално подпомагане на проекта? Било то с изходните кодове на речника
или по друг начин?
</pre>
</blockquote>
<pre>6. Немалка част от тези от ИБЕ при БАН живеят в епохата на 1990-те и още \
не са си оправили жалкото онлайн подобие на многотомния си речник (
<a href="http://ibl.bas.bg/rbe/" target="_blank">http://ibl.bas.bg/rbe/</a>, едва \
Борислав Манолов от „Читанка“ го направи по-ползваем чрез неговия frontend на речника \
им: <a href="http://rbe.chitanka.info" target="_blank">http://rbe.chitanka.info</a>), \
не можем да очакваме реална помощ от тях, въпреки че можем да се пробваме поне да ги \
помолим да ни предоставят базата от данни на речника си, но по-скоро ми се струва, че \
ще се заинатят и ще си държат на „авторското право“ над базата от данни...</pre>
</blockquote></div></div>
Мхъм, мъхъм, номерът с авторското право, естествено.<br>
<blockquote type="cite"><span class="">
<pre>7. Само тези от Секцията по компютърна лингвистика към БАН са напред с
материала (<a href="http://dcl.bas.bg/programs_bg.html" \
target="_blank">http://dcl.bas.bg/programs_bg.html</a>, <a \
href="http://dcl.bas.bg/resources_bg.html" \
target="_blank">http://dcl.bas.bg/resources_bg.html</a> и особено <a \
href="http://dcl.bas.bg/dictionaries_bg.html" \
target="_blank">http://dcl.bas.bg/dictionaries_bg.html</a>) и само на тях възлагам \
надежди. Те имат публикувани свободни данни, като честотен речник, генериран от \
корпус, които могат евентуално да се вградят в речниковата база на „БГ Офис“, но и
за тях не е ясно дали са проверени от човек за правописни грешки и дали ще
се съгласят да ни дадат базите си от данни на речниците си, което де факто
означава да ги пуснат под свободен лиценз...
Не смятам, че е лош вариант да се смени първоизточника и за основа да се
</pre>
<blockquote type="cite">
<pre>използва нещо по-осъвременено, не разбирам идеята да има няколко еднакви
начинания за едно и също нещо и нито едно от тях да не връща обратно за
постигане на целта на първоизточника – по-добър БГ Офис.
</pre>
</blockquote>
</span><pre><span class="">
8. Реално няма чак толкова много речници що се отнася до spellchecker-и за
българския език, освен официалната добавка за Firefox, наречена „Проверка
на правописа
</span><a href="https://addons.mozilla.org/en-US/firefox/addon/bulgarian-dictionary/" \
target="_blank"><https://addons.mozilla.org/en-US/firefox/addon/bulgarian-dictionary/></a>“
(използва myspell, може би е основана речник от „БГ Офис“?), има само
добавките „Bulgarian+English Dictionary“, „Bulgarian+German Dictionary“ и
добавка със стария иванчевски правопис, който не е актуален. Само при
онлайн речниците на българския език има по-голямо разнообразие, защото
нишата още не е доминирана от по-сложно устроен свободен онлайн речник
(какъвто ще бъде нашият проект „Словник“), само <a href="http://rechnik.info" \
target="_blank">rechnik.info</a>, <span class=""><a href="http://onlinerechnik.com" \
target="_blank">onlinerechnik.com</a>, <a href="http://eurodict.com" \
target="_blank">eurodict.com</a> и <a href="http://rechnik.chitanka.info" \
target="_blank">rechnik.chitanka.info</a> се използват реално, другите са с много \
ограничена употреба. Имам дълъг списък с такива български онлайн речници — ако \
искате, ще ви го изпратя.</span></pre> </blockquote>
Добавката използва форматиран .aff от ООо. Имах предвид главно „IDI
Spell Checker“ и речникът на Читанка. Читанката я обсъдихме като
ненадежден източник.<span class=""><br>
<blockquote type="cite">
<pre> Склонен съм да използвам текстова база от данни стига това да има
</pre>
<blockquote type="cite">
<pre>някакъв резултат, въпреки наличието на структурирани данни от базата на
„Читанка“ (които по обективни причини са неизползваеми за целта).
</pre>
</blockquote>
<pre>9. Просто няма друг вариант в случая, освен използването на текстова база
от данни — все пак „БГ Офис“ използва aspell и ispell (не знам дали
използва hunspell, myspell и/или enchant), които доколкото знам работят
само с текстови файлове. Поправете ме, ако греша.</pre>
</blockquote></span>
Амии, има други варианти. Една реализация е именно речникът на
Читанка. Структурата на базата е добра. Вече нещата опират до набор
от инструменти, с които се борави с тези данни. Дали ще се извеждат
в текстови файлове или данните ще се обработват по друг начин е без
значение. Истината е, че в момента мигриране към база от данни няма
да допринесе с нищо, а напротив. Инфраструктурата (скриптовете
генериращи различните неща) на проекта очевидно работи в този ѝ вид.<span \
class=""><br> <blockquote type="cite">
<pre>10. Сега видях от <a \
href="https://svn.code.sf.net/p/bgoffice/code/trunk/bgoffice/" \
target="_blank">https://svn.code.sf.net/p/bgoffice/code/trunk/bgoffice/</a>, че .dat \
файловете на „БГ Офис“ са всъщност обикновени текстови файлове, а аз си мислех, че са \
двоични файлове... Но всички файлове са в Windows-1251, трябва да се конвертират до \
UTF-8.</pre> </blockquote></span>
Господин Раднев, смятам, ще се съгласи с това твърдение. Аз също съм
твърдо „за“.<span class=""><br>
<blockquote type="cite">
<pre>11. Мисля, че на първо време е най-добре г-н Раднев или вие, г-н Димитров,
да направите копие на всичко от „БГ Офис“ (в SourceForge) в GitHub и да си
сътрудничим по проекта там, защото просто не разбирам нищо от SVN. :D После
не би било проблем да копираме новите издания от GitHub като нови версии в
SVN-то на хостигна на „БГ Офис“ в SourceForge.</pre>
</blockquote></span>
Точно това искам да избегна. Поредното копие на „БГ Офис“. Наистина
разликата е, че то ще е общодостъпно, но все пак е копие. От друга
страна като за работа от повече хора GitHub е по-добрият вариант,
несъмнено. Все пак това е целта му.<br>
Господин Раднев, какво е вашето мнение? От друга страна, какви са
критериите за получаване на commit права върху хранилището или части
от него? Как става преглеждането и приемането/отхвърлянето на
промени правени от други?<br>
<blockquote type="cite"><span class="">
<pre>П.П. Ех, писмото ми пак стана прекалено дълго. :D Май ще забравите за \
какво съм писал докато четете, затова номерирах абзаците, за да ви е е по-лесно
да ги цитирате и да ги обсъдим. :)
Поздрави,
Sah War (sahwar)
</pre>
<br>
<fieldset></fieldset>
<br>
</span><span class=""><pre>_______________________________________________
Dict mailing list
<a href="mailto:Dict@ludost.net" target="_blank">Dict@ludost.net</a>
<a href="http://lists.ludost.net/cgi-bin/mailman/listinfo/dict" \
target="_blank">http://lists.ludost.net/cgi-bin/mailman/listinfo/dict</a> </pre>
</span></blockquote>
[1] <a href="http://eenk.com/postavyane-na-udareniya-na-kirilitsa-s-html" \
target="_blank">http://eenk.com/postavyane-na-udareniya-na-kirilitsa-s-html</a><span \
class=""><font color="#888888"><br> <pre cols="72">--
С</pre>
</font></span></div>
<br>_______________________________________________<br>
Dict mailing list<br>
<a href="mailto:Dict@ludost.net">Dict@ludost.net</a><br>
<a href="http://lists.ludost.net/cgi-bin/mailman/listinfo/dict" \
target="_blank">http://lists.ludost.net/cgi-bin/mailman/listinfo/dict</a><br> \
<br></blockquote></div><br></div></div>
_______________________________________________
Dict mailing list
Dict@ludost.net
http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
[prev in list] [next in list] [prev in thread] [next in thread]
Configure |
About |
News |
Add a list |
Sponsored by KoreLogic