Corpus HSK: parte seconda

Continuando la traccia del precedente articolo, ecco gli ultimi aggiornamenti e novità per il Corpus HSK.

La lista HSK 4 in formato testo è stata aggiornata includendo il livello HSK; ogni riga di questo file contiene ora una singola parola con quattro campi divisi da una tabulazione:

  • caratteri semplificati
  • pinyin
  • livello HSK
  • definzione (in Italiano)

Il relativo file Excel è sempre disponibile a questo indirizzo.

Lista HSK4 in formato JSON: si tratta di un formato "tecnico" di interscambio dati, caratterizzato da una facile lettura; questo file può essere utilizzato per la realizzazione di pagine web e programmi di vario tipo. Qui di seguito un esempio della struttura del file (testuale):

{
    "HSK4": [
        {
            "character": "爱",
            "pinyin": "ài",
            "HSK": "1",
            "ita": "{v.} amare {v.} piacere"
        },
        {
            "character": "八",
            "pinyin": "bā",
            "HSK": "1",
            "ita": "{num.} otto"
        },

Il file è stato "validato" per la sintassi JSON e l'ho personalmente utliizzato per un paio di script perl.

Un terzo documento a supporto dello studio dei vocaboli HSK è rappresentato da un semplice foglio Excel nel quale ho raccolto una prima serie di frasi in cinese con la relativa traduzione in Italiano come nell'esempio qui sottostante:

Italiano Cinese
E' uno studente dell'università di Pechino 他是北京大学的学生。
Sei cinese? 你是中国人吗?
Sai parlare inglese? 你会说英语吗?
Ti piace bere il te? 你喜欢喝茶吗?
Non so parlare inglese 我不会说英文。
Lui non sa parlare cinese 他不会说中文。
Io non studio i caratteri cinesi 我不学汉字。
Io so scrivere il mio nome 我会写我的名字。
Dove lavori? 你在哪里工作?

Il foglio Excel è disponibile a questo link: se avete delle idee su come "arricchire" questo file fatemelo sapere: e ovviamente se vedete degli errori di traduzione segnalatemelo!

Alla prossima!