Tisztelt Lista!
A
http://hix.hu/ziBuw-mokk.bme.hu
oldalon szereplő alábbi szöveg fordítására lenne szükségem. Bár az
oldalon be lehet állítani a magyar nyelvet, ez a beállítás kizárólag a
menüre hat.
A Google fordító nem adott használható eredményt.
Nagyon szépen kérem a T. Listát, hogy részemre -akár magánban - a
fordítást küldjék el.
Előre is nagyon szépen köszönöm!
Sok sikert!
Torma István
Corpus
We only make the 4% threshold corpus available for download (the others
are available upon request), since this one already has 589 million
words from 1,221 million Hungarian web pages, and it is 4Gb even in
zipped format. It is published in 10, almost identical but independent
parts, each in a tar.gz file.
Depending on the size of the corpus you need, download one or more files
and unzip them in the same folder. The documents unzip in differnet
files in the content/ folder, each segmented into words and sentences,
in rough XML format (& signs are not coded).
|