[福利]Odmiana przez przypadki online 常见斯拉夫语(含DSB及HSB语)及LV、FI语名词变格器 阅读:9143回复:10
以前老有个人私信追问UK语还是什么语怎么变格有没有相关工具,要画斯拉夫变格表时用到。不好意思,那工具我暂时还得回去给你找找。但是最近无独有偶,倒是搞到个另外的变格器,包含了PL/RU/CS/SK/HR/SL/SR/LV/FI/AR/DE/HSB(高地索布语。还没建好,尚不可用)/DSB(低地索布语。已有部分词可用)这几语的变格数据库,除LV(拉脱)FI(芬)AR(阿)DE(德)以外其他的都是斯拉夫语,你有兴趣的话可以玩玩:
http://aztekium.pl/przypadki.py?lang=pl Odmiana przez przypadki online 图片:Odmiana przez przypadki online.png 不足之处: 1) 该变格器似乎仅波兰语有复数变格(点击右侧的多人头像即可),其余语言的复数变格,需手动输入该名词复数主格方可查询,如: 图片:Odmiana przez przypadki online 2.png 2) 如果你的要求比较“高级”,需要查一些比较偏门的名词,你恐怕要失望了,因为该变格器的数据库很小,尤其是低索(dolnoserbski, HSB: delnjoserbšćina),只有少数常见名词有相关变格数据。而高索(hornjoserbšćina, DSB: górnoserbski)的数据库则根本还没建好,一个都查不了 波兰人名变格器,有兴趣也可以玩玩: http://nlp.actaforte.pl:8080/Nomina/Nazwiska [ask于2017-01-23 17:12编辑了帖子]
|
以前老有个人私信追问UK语还是什么语怎么变格有没有相关工具,要画斯拉夫变格表时用到。不好意思,那工具我暂时还得回去给你找找。
------------ UK-UA变位变格器: словозміна (для української мови) http://lcorp.ulif.org.ua/dictua 图片:scr.png |
@dekdentei 你不是给我发过私信要变位变格器用于画表格和列举斯拉夫名词动词形态变化那堆东西吗,喏,楼上就是你要的。以后注意说话客气点
这种形态变来变去的玩意,网上并不是到处都有,但西方几乎所有国家都有专门的人工智能小组研发这种NLP工具,根本不需要自己去花时间收集或列举。这些形态变来变去的都是些最最low和basic的东西,用得多了自然就不用查了 |
语言关键是要自己去多用(多读,多写,多听,多说),自己从来不用不学,为一堆“词典”“语法书”之类的东西纠结得要命,几个形态变来变去的东西见了都吓尿成一团,纠缠列举了半天变位变格都没像样学过半句外语,没出息
|
注意,对于个别非常用词,不能排除这类NLP工具出错的可能性,虽然整体比例不高:
例如:对比https://pl.wiktionary.org/wiki/obywatel上给出的obywatel的变位情况 图片:obywatel_wiktionary.png 可以看到obywatel的复数宾格(第四格)biernik是obywateli,符合M1性的变格。 但是,在加入前缀współ-从而构造为współobywatel(obywatel=DE-DE Bürger/FR-FR citoyen/EN-GB citizen,所以współobywatel=DE-DE Mitbürger/FR-FR concitoyen/EN-GB fellow citizen)之后,这个词就属于aztekium数据库所未收录的非常用词,结果它的词形变化就出现了错误: 图片:współobywatel_aztekium.png 这时,我们考虑把此处不常用的współ-前缀去掉: 图片:obywatel_aztekium.png 可以看到,这时背景色重新又变成了绿色,表明这词是数据库里已有且已验证过的正规词,而obywatel的复数biernik(即accusative)型也相应恢复成了正确的obywateli(而非obywatele),这就反过来说明,wiktionary上的变格是正确的,współobywatel的复数宾格也应是współobywateli,并不是współobywatele,只是aztekium数据库没有provide for像współobywatel这种偏门词的m generation、此时它利用经验算法想当然地“推导”普通阳性名词复数宾格而导致的纰漏 所以这种东西完全是自己动动脑子就能解决的事情,根本不需要有求于人。@Nyuggu 明白吗?多用用脑子,没坏处 [ask于2017-01-23 23:16编辑了帖子]
|
我试用了一下,这个词典的sk版不是很好,建议改用:
http://slovniky.korpus.sk 例如: http://slovniky.korpus.sk/?w=užívateľ 拖到页面最下方即可见名词užívateľ的变格情况: 图片:slovenské slovníky.png 对于偏门名词,如果你有cs语基础,可按cs-cz与sk-sk的音位对应情况来推测 |
顺带把上次这个帖子里的分析器也加到本贴,便于查找:
http://www.somdom.com/general/t39684#read_149046 http://hml.ffzg.hr/hml与楼顶的区别在于楼顶仅限名词变位的生成,而该工具则用于包括名词在内的各种词性的词的分析 |
网上的Cool变位器上拼写有误,ET-EE复合过去时三复的助动词应为olid,非oli,标注一下,已提交报告反映,待修正
[ask于2017-06-02 12:12编辑了帖子]
|
例如:
Ma olin koolitanud Sa olid koolitanud Ta oli koolitanud Me olime koolitanud Te olite koolitanud Nad olid koolitanud Negative ei olnud koolitanud, polnud koolitanud Passive oli koolitatud Pass. Neg. ei olnud koolitatud, polnud koolitatud 唯一用途是该变位器适合在无翻墙条件(例如,在外出无wifi时,无法使用PAC翻墙)而无法访问filo时,个别为verbix不提供ET-EE的conjugation服务而烦恼的初学者可以使用该款变位器 [ask于2017-06-02 12:22编辑了帖子]
|
贴一个从ČT下载捷克语视频的方法:由于今年二月ČT把m3u8改成了mpd格式,完全就是碎片化的流媒体,给下载带来不少麻烦,下文就是为解决这个问题的。字幕需另行制作:
http://www.abclinuxu.cz/blog/obcasny_blog/2017/6/stazeni-videa-z-archivu-ceske-televize-do-archivu-vlastniho 核心部分是几个命令行: cat IS.mp4 $(ls -vx *.m4s) > video.mp4 cat IS.mp4 $(ls -vx *.m4s) > audio.mp4 ffmpeg -i video.mp4 -i audio.mp4 -c copy movie.mkv Případně zmenšit (H.265): ffmpeg -i movie.mkv -c:v libx265 -preset medium -crf 28 -c:a aac -b:a 128k output.mp4 |
再弄个专业点的芬兰语变位变格生成器(只列举了部分变格:主、属、部分、入,但用这几个已足够推导出其他格形态,也可再配合其他分析器验证),有兴趣的可以用用:
http://www.kielitoimistonsanakirja.fi/netmot.exe?motportal=80 图片:Screenshot_20171120-182206.png [ask于2017-11-20 18:28编辑了帖子]
|