Griglie per scrivere in cinese: alcuni aggiornamenti

Giornata di grandi pulizie in casa e anche sul sito: controllando i link del Sinonauta ho scoperto con mio grande rammarico che il sito "definitivo" delle griglie ChinesePracticePaper da me commentato in un precedente ariticolo è scomparso. Sopravvive per fortuna una buona parte delle griglie nella pagina https://chinesepracticepaper.appspot.com/ ma con solo il 70% dei contenuti originali.

Davvero un peccato, questo sito forniva davvero tutto quanto poteva essere necessario allo studio in formato gratuito e di qualità: purtoppo bisogna evitare di dare per scontato che quanto disponibile oggi in rete lo sarà anche domani e quindi quando si trovano dei contenuti davvero interessanti è sempre meglio farsene una copia in locale. Ottimo consiglio che ovviamente io stesso non seguo: tanto per fare un esempio mi sono lasciato "scappare" le liste dei vocaboli del nuovo HSK con traduzione italiana del sito http://zhengwen.chinese.cn/hsk.jsp, ormai da mesi defunto e unica fonte a tutt'oggi di questi documenti.

 

Corpus HSK: parte seconda

Continuando la traccia del precedente articolo, ecco gli ultimi aggiornamenti e novità per il Corpus HSK.

La lista HSK 4 in formato testo è stata aggiornata includendo il livello HSK; ogni riga di questo file contiene ora una singola parola con quattro campi divisi da una tabulazione:

  • caratteri semplificati
  • pinyin
  • livello HSK
  • definzione (in Italiano)

Il relativo file Excel è sempre disponibile a questo indirizzo.

Lista HSK4 in formato JSON: si tratta di un formato "tecnico" di interscambio dati, caratterizzato da una facile lettura; questo file può essere utilizzato per la realizzazione di pagine web e programmi di vario tipo. Qui di seguito un esempio della struttura del file (testuale):

{
    "HSK4": [
        {
            "character": "爱",
            "pinyin": "ài",
            "HSK": "1",
            "ita": "{v.} amare {v.} piacere"
        },
        {
            "character": "八",
            "pinyin": "bā",
            "HSK": "1",
            "ita": "{num.} otto"
        },

Il file è stato "validato" per la sintassi JSON e l'ho personalmente utliizzato per un paio di script perl.

Un terzo documento a supporto dello studio dei vocaboli HSK è rappresentato da un semplice foglio Excel nel quale ho raccolto una prima serie di frasi in cinese con la relativa traduzione in Italiano come nell'esempio qui sottostante:

Italiano Cinese
E' uno studente dell'università di Pechino 他是北京大学的学生。
Sei cinese? 你是中国人吗?
Sai parlare inglese? 你会说英语吗?
Ti piace bere il te? 你喜欢喝茶吗?
Non so parlare inglese 我不会说英文。
Lui non sa parlare cinese 他不会说中文。
Io non studio i caratteri cinesi 我不学汉字。
Io so scrivere il mio nome 我会写我的名字。
Dove lavori? 你在哪里工作?

Il foglio Excel è disponibile a questo link: se avete delle idee su come "arricchire" questo file fatemelo sapere: e ovviamente se vedete degli errori di traduzione segnalatemelo!

Alla prossima!

Corpus HSK: parte prima

Come anticipato in un precedente articolo, sto lavorarando ad un insieme di documenti legati all'HSK che possano essere utilizzati come base per lo studio: ecco dunque i primi risultati.

Lista HSK livelli 1-4 (aggiornata 2012) in formato Exel contenente:

  • definzione (in Italiano)
  • caratteri semplificati
  • pinyin
  • esempi di utilizzo
  • note grammaticali
  • livello HSK (2012)

Qui di seguito potete vedere un esempio del contenuto: ho corretto numerosi errori ortografici presenti nel documento orignale di partenza, aggiunto esempi e sistemando le parti incomplete. Questo documento rappresenta la copia "master" dalla quale partire per creare le altre versioni (testo, Anki…)

Nota di servizio: la parola 677 del livello 4 (当) non è presente nel file originale quindi ho inserito i significati più comuni e i relativi esempi: mi prendo in questo caso la piena responsabilità di eventuali errori.


Lista HSK 4 in formato testo; ogni riga contiene una singola parola con tre campi divisi da una tabulazione:

  • caratteri semplificati
  • pinyin
  • definzione (in Italiano)

Il formato è quindi

<<carattere semplificato>> [TAB] <<pinyin> > [TAB] <<significato della parola>>

Se una parola ha più di un significato il terzo campo conterrà i vari significati separati da un ";" come nel caso qui sotto

回    huí    {v.} ritornare; tornare indietro {cl.v.} numero di volte

Questo file è stato esplicitamente pensato per essere importato nei vari programmi/siti destinati allo studio del cinese (es. Anki).


File ANKI per la lista HSK 4 (contenuto in un file .ZIP, per qualche motivo non posso pubblicare il file .apkg): ho importato il file qui sopra e creato un mazzo Anki pronto per poter essere utilizzato (1200 schede). Il risultato finale lo potete vedere nella scheda qui sotto: come da tradizione viene presentato il solo carattere per il quale occorre "indovinare" pronuncia e definizione.

In particolare per il primo documento vi chiederei un feedback in modo da poter individuare gli inevitabili errori ed imprecisioni. A breve rilascerò i files relativi ai livelli 1,2 e 3.

 

Audio completo HSK livello 3

Come anticipato nel precedente articolo, ecco finalmente disponibili i 578 files relativi a tutte le parole del livello 3 dell'HSK (ovviamente parole con la stessa pronuncia condividono un singolo file).

Il file .zip lo trovate qui (sono circa 7MB): ciascuna parola è stata salvata utilizzando un nome file derivato del pinyin, come ad esempio "zi4xing2che1.mp3" o "xing4qu4.mp3". Unica eccezione è il carattere "ǚ" che per motivi "tecnici" è stato sostituito dalla semplice "u": ad esempio la parola nǚrén corrisponde al file nu3ren2.mp3.

Trattandosi della prima versione di questo archivio audio è probabile ci possano essere errori, imprecisioni o "problemi" di varia natura: vi chiedo ovviamente di segnalarmeli in modo da poter migliorare l'archivio.

Come tutte le altre risorse di questo sito, il file audio è disponibile gratuitamente: vi chiedo cortesemente di non farne alcun uso di carattere commerciale.

Il prossimo passo nella realizzazione del corpus HSK sarà quello di realizzare un primo semplice "Indice" delle parole con relativo livello HSK: in questa occasione dovrei anche essere in grado di realizzare velocemente due nuovi archivi audio mirati al livello 1 e 2, che per ora vi lascio come "compito a casa".

nciku cessa di esistere, arriva LINE Dictionary

Ho scoperto da poco che il sito nciku, di cui avevo parlato in passato e che metteva a disposizione diverse utili risorse, ha cessato di operare. Al suo posto ora appare LINE Dictionary: qui di seguito potete vedere il messaggio che viene presentato se provate ad accedere con i vecchi link di nciku:

La struttura del nuovo LINE Dictionary è abbastanza semplice: il cuore del servizio è il vocabolario che risulta piuttosto "essenziale". Qui di seguito un esempio per padre (父亲)

Come si può notare per il vocabolo cinese sono riportate al momento solo le informazioni essenziali: la parte più interessante sono certamente gli esempi di utilizzo delle parole, decisamente numerosi. Peccato che questi esempi non siano "attivi", ovvero non si possa cliccare sulle parole per un approfondimento del termine presentato: da quanto dicono gli autori questa opzione verrà introdotta nel 2015… Spero inseriscano anche un link diretto ad altri dizionari quali l'MDGB.

E' possibile inserire i caratteri non solo mediante tastiera ma anche disegnandoli con il mouse (operazione per me quasi impossibile): nulla di nuovo, è vero, ma questa funzione in questo sito risulta molto ben fatta e veloce rispetto a quanto presente altrove (ad esempio nell'MDBG).

La componente del dizionario Cinese-Inglese è decisamente più ricca ed utile: ad esempio volendo cercare una traduzione per "casa" otteniamo queste informazioni

Sono anche riportati (ove presenti) i principali sinonimi della parola cercata

Anche qui diversi esempi arricchiscono il risultato: neppure in questo caso è possibile selezionare una delle altre parole nell'esempio per un approfondimento.

Rispetto al vecchio nciku manca un'enorme quantità di servizi, primo fra tutti la visualizzazione dell'ordine dei tratti dei caratteri (al quale avevo creato un link nella pagina degli "Strumenti e siti utili" di questo blog): gli autori come detto rimandano a gennaio 2015 per queste funzioni quindi anche io rimando la recensione ufficiale al prossimo anno.