Corpus HSK: parte seconda

Continuando la traccia del precedente articolo, ecco gli ultimi aggiornamenti e novità per il Corpus HSK.

La lista HSK 4 in formato testo è stata aggiornata includendo il livello HSK; ogni riga di questo file contiene ora una singola parola con quattro campi divisi da una tabulazione:

  • caratteri semplificati
  • pinyin
  • livello HSK
  • definzione (in Italiano)

Il relativo file Excel è sempre disponibile a questo indirizzo.

Lista HSK4 in formato JSON: si tratta di un formato "tecnico" di interscambio dati, caratterizzato da una facile lettura; questo file può essere utilizzato per la realizzazione di pagine web e programmi di vario tipo. Qui di seguito un esempio della struttura del file (testuale):

{
    "HSK4": [
        {
            "character": "爱",
            "pinyin": "ài",
            "HSK": "1",
            "ita": "{v.} amare {v.} piacere"
        },
        {
            "character": "八",
            "pinyin": "bā",
            "HSK": "1",
            "ita": "{num.} otto"
        },

Il file è stato "validato" per la sintassi JSON e l'ho personalmente utliizzato per un paio di script perl.

Un terzo documento a supporto dello studio dei vocaboli HSK è rappresentato da un semplice foglio Excel nel quale ho raccolto una prima serie di frasi in cinese con la relativa traduzione in Italiano come nell'esempio qui sottostante:

Italiano Cinese
E' uno studente dell'università di Pechino 他是北京大学的学生。
Sei cinese? 你是中国人吗?
Sai parlare inglese? 你会说英语吗?
Ti piace bere il te? 你喜欢喝茶吗?
Non so parlare inglese 我不会说英文。
Lui non sa parlare cinese 他不会说中文。
Io non studio i caratteri cinesi 我不学汉字。
Io so scrivere il mio nome 我会写我的名字。
Dove lavori? 你在哪里工作?

Il foglio Excel è disponibile a questo link: se avete delle idee su come "arricchire" questo file fatemelo sapere: e ovviamente se vedete degli errori di traduzione segnalatemelo!

Alla prossima!

Corpus HSK: parte prima

Come anticipato in un precedente articolo, sto lavorarando ad un insieme di documenti legati all'HSK che possano essere utilizzati come base per lo studio: ecco dunque i primi risultati.

Lista HSK livelli 1-4 (aggiornata 2012) in formato Exel contenente:

  • definzione (in Italiano)
  • caratteri semplificati
  • pinyin
  • esempi di utilizzo
  • note grammaticali
  • livello HSK (2012)

Qui di seguito potete vedere un esempio del contenuto: ho corretto numerosi errori ortografici presenti nel documento orignale di partenza, aggiunto esempi e sistemando le parti incomplete. Questo documento rappresenta la copia "master" dalla quale partire per creare le altre versioni (testo, Anki…)

Nota di servizio: la parola 677 del livello 4 (当) non è presente nel file originale quindi ho inserito i significati più comuni e i relativi esempi: mi prendo in questo caso la piena responsabilità di eventuali errori.


Lista HSK 4 in formato testo; ogni riga contiene una singola parola con tre campi divisi da una tabulazione:

  • caratteri semplificati
  • pinyin
  • definzione (in Italiano)

Il formato è quindi

<<carattere semplificato>> [TAB] <<pinyin> > [TAB] <<significato della parola>>

Se una parola ha più di un significato il terzo campo conterrà i vari significati separati da un ";" come nel caso qui sotto

回    huí    {v.} ritornare; tornare indietro {cl.v.} numero di volte

Questo file è stato esplicitamente pensato per essere importato nei vari programmi/siti destinati allo studio del cinese (es. Anki).


File ANKI per la lista HSK 4 (contenuto in un file .ZIP, per qualche motivo non posso pubblicare il file .apkg): ho importato il file qui sopra e creato un mazzo Anki pronto per poter essere utilizzato (1200 schede). Il risultato finale lo potete vedere nella scheda qui sotto: come da tradizione viene presentato il solo carattere per il quale occorre "indovinare" pronuncia e definizione.

In particolare per il primo documento vi chiederei un feedback in modo da poter individuare gli inevitabili errori ed imprecisioni. A breve rilascerò i files relativi ai livelli 1,2 e 3.

 

Alla ricerca di un corpus HSK

Innanzitutto Buon Anno a tutti! Spero sinceramente che questo 2015 sia molto meno avaro del 2014, specialmente lato salute e lavoro.

In questi giorni di ferie, a parte smaltire le sbornie alimentari, sto lavorarando ad un progetto personale, ovvero la realizzazione di un piccolo "corpus" HSK. Come sapete, il termine corpus indica di norma una collezione di testi selezionati e organizzati per facilitare le analisi: nel mio caso mi vorrei limitare a creare una collezione "mirata" sulle parole HSK che preveda, per ciascun lemma

  • definzione (in Italiano)
  • caratteri semplificati
  • pinyin
  • esempi di utilizzo
  • note grammaticali
  • audio
  • (opzionale) lista dei tratti per la scrittura
  • livello HSK (2012)

Tale corpus sarà reso disponibile in diversi formati (Excel, testo, JSON in primis) in modo da poter essere utilizzabile in modo veloce per diversi scopi, ma in primis lo studio delle parole stesse e la realizzazione di strumenti per lo studio simili a quelli che l'amico sinonauta di Cinesando mette già a disposizione.

In rete si trovano diverse risorse sull'HSK ma spesso sono solo in inglese (vedi ad es. l'articolo sul sito hskhsk) e non facilmente "riutilizzabili": la mia idea è quella di razionalizzare molto del materiale esistente aggiungendo quanto necessario per avere un insieme organico e chiaro. L'obiettivo è quello di realizzare delle risorse in italiano ma con uno sforzo limitato penso si potrà espandere il corpus anche all'inglese.

In questo preciso momento sto sistemando i files audio che la mia gentilissima insegnante di cinese mi ha preparato con tutte le parole dell' HSK3: nei prossimi giorni inizierò con il pubblicare la lista dei file mp3 in modo da poter mettere a disposizione una base audio di buona qualità e gratuita a tutta la comunità. In seguito completerò il lavoro sulla parte dei metadati relativi a ciascuna parola: l'idea è quella di rilasciare il materiale in modalità progressiva in modo da poter anche usufruire dei vostri commenti/suggerimenti.

Fin da ora ovviamente ogni vostro contributo è più che ben accetto: sto ad esempio cercando un sito dove reperire, almeno per i primi 4 livelli, la lista dei tratti per la scrittura di ciascun carattere in formato grafico (non animato). Se qualcuno ha un idea di dove andare (la wikipedia non sembra al momento completa) lasci pure un commento in calce a questo articolo.

Ancora auguri a tutti.

G

Preparazione online per l’esame HSK: la proposta di Gurulu

In rete è possibile trovare diversi siti che permettono la verifica del livello di preparazione dell'esame HSK: in questo articolo troverete la mia esperienza con la proposta di Gurulu (www.gurulu.com), uno dei siti che a mio parere offre il migliore ambiente per la preparazione HSK. Gurulu propone, oltre alla componente HSK, anche moltissime lezioni di ottimo livello, ma in questo articolo mi concentrerò solo solo sulla parte HSK, ed in particolare sulla preparazione per il livello 3 (Gurulu supporta il livelli da 1 a 5).

Scegliere la modalità di studio

Il pannello di controllo posto sulla destra permette di controllare il tipo di esercizio che si vuole realizzare: è possibile scegliere il livello HSK, il tipo di esercizio (lettura/scrittura/ascolto) e la modalità di esecuzione (prova libera o test di prova). Le diverse combinazioni permettono di determinare in modo preciso quale tipo di esercizio si vuole effettuare: in particolare la "free practice" permette di lavorare in modo libero sui singoli esercizi, mentre il "practice test" ci mette di fronte ad una prova completa e quindi richiede maggior tempo e concentrazione.

In fase di preparazione le prove libere casuali (modo: Auto) rappresentano la soluzione migliore in quanto forniscono l'intero spettro di esercizi. Per ciascun esercizio sono raccolte e messe a disposizione molte statistiche che permettono di monitorare i propri progressi. Vediamo in dettaglio le tre modalità di studio.

Ascolto

In questo tipo di esercizio viene presentata due volte una frase, al termine della quale occorre rispondere scegliendo una delle possibili risposte. Il sistema tiene in considerazione con un timer il tempo effettivo che si avrà in sede di esame per rispondere: al termine del tempo previsto la risposta viene comunque presentata, indipendentemente da quanto fatto.

Sono diponibili diverse modalià di prova: la prima è quella che prevede di scegliere la risposta tra una serie di immagini

Il secondo tipo di prova di ascolto richiede di ascoltare un breve dialogo e poi selezionare una tra le risposte proposte in forma scritta:

Una volta scelta la risposta (o trascorso il tempo) viene presentato l'intero testo dell'esercizio e la risposta corretta. Ecco il testo associato al caso precedentemente visto (la risposta correttà e evidenziata con un box in verde).

Ciascuna parola è cliccabile per avere un maggior dettaglio: quando più di un carattere concorre alla creazione di una parola il gruppo viene sottolineato in modo da poterlo direttamente selezionare. Cliccando ad esempio su 明 si ottiene nel box a sinistra il dettaglio che vedete qui sotto: viene in questo box riportata la traduzione, la possibilità di riascoltare la parola e, ove presente, la "storia" proposta per aiutare a memorizzare la parola stessa.

Questa possibilità di rivedere tutto il testo dell'esercizio selezionando le singole parole per un'analisi di dettaglio è a mio parere uno degli strumenti più importanti messi a disposizione dal sito. In questo modo infatti è possibile verificare con precisione sia la comprensione dei dialoghi, sia la compenza relativa alle singole parole.

Lettura

Le prove di lettura seguono quelle del test ufficiale: la maggiore difficoltà di questa parte di esame è per me rappresentata dal poco tempo a disposizione per leggere il testo; non si tratta tanto di riconoscere i singoli vocaboli (già di per sè un problema) ma di acquisire la necessaria velocità per leggere diverse pagine di cinese in poche decine di minuti. Gli esercizi proposti da Gurulu sono associati ad un timer che rappresenta il tempo massimo per la risoluzione della singola prova: nella realtà non c'è un tempo associato alla singola domanda, ma poichè si deve completare il gruppo di esercizi in un dato tempo, l'unico modo è quello di essere abbastanza "veloci" in ciascun esercizio. Il mio consiglio è quindi il seguente: se quanto leggete proprio non sembra avere un senso, saltate all'esercizio successivo e non ostinatevi a cercare di comprendere tutto.

Il primo esercizio di lettura è quello di riempimento degli spazi vuoti, dove occorre scegliere una parola tra quelle proposte

Una seconda prova di lettura richiede di individuare la frase corretta da associare a quella proposta. Questo è un esercizio particolarmente ostico per la mia attuale competenza in quanto il testo iniziale è molto corto e quindi non permette di individuare chiaramente il contesto in cui ci si sta muovendo: le frasi da associare devono quindi essere tutte analizzate con una certa attenzione per capire quale associare, senza poter rapidamente "scartare" quelle evidentemente fuori contesto (ad esempio, se capisco che stiamo parlando di cibo, una frase che parla di vestiti la posso eliminare anche se compresa solo in parte).

Una ulteriore variante prevede un breve testo, seguito da una domanda alla quale occorre selezionare la risposta corretta. In questo caso il contesto è molto ampio (forse anche troppo!) e risulta quindi più facile trovare la risposta corretta, sempre si sia riusciti a leggere e comprendere tutto il testo (torniamo qui ai miei problemi di velocità di lettura di cui ho parlato in un articolo precedente).

Scrittura

La parte di scrittura è oggettivamente quella che permette il minor controllo da parte di un servizio web: nonostante alcuni siti (Skritter in primis) permettano di scrivere un carattere e di verificarne la correttezza, la possibilità di correggere un testo scritto via web è oggi molto limitata, specie per il fatto che si dovrebbe utilizzare nella maggior parte dei casi un mouse, certo non lo strumento più adatto.

In ogni caso con Gurulu potete effetturare entrambe le prove HSK3: il primo caso è quello della scrittura di un carattere a partire dal relativo pinyin:

L'esercizio "reale" prevede la scrittura su carta, moooooolto diversa da quella mediata da un qualsiasi dispositivo informatico (pc o tablet). Dovendo qui riempire un campo testuale, si farà uso di una delle tante tastiere in cinese messe a disposizione dall'ambiente di lavoro, azzerando quasi la possibilità di una reale verifica di quanto fatto. Personalmente affronto questo esercizio in due fasi: scrivo su un foglio di carta il carattere e poi lo digito via tastiera per il controllo.

Il secondo esercizio di scrittura è nettamente più efficace: qui dobbiamo infatti riordinare una serie di caratteri per formare una frase compiuta

In questo caso anche con il copia-incolla rimane conservato il cuore dell'esercizio, ovvero identificare la struttura della frase presentata.

VocabXpress

In aggiunta agli strumenti presentati, ritengo degno di nota il piccolo sussidio chiamato VocabXpress: nel box a sinistra (dove appare la definizione delle parole selezionate nel testo degli esercizi) è possibile infatti attivare una funzione utile per la memorizzazione delle parole. Si può qui selezionare la lista HSK e il programma vi presenterà una parola casuale (con relativa pronuncia) alla quale dovrete associare il corretto significato.

Al termine della prova viene mostrata la solita scheda descrittiva della parola: niente di trascendentale, è vero, ma la conoscenza del vocabolario HSK è essenziale per superare l'esame e quindi questo piccolo aiuto risulta comunque decisamente utile.

Prezzi

La preparazione HSK costa 39.9€ per tre mesi, 59.9€ per 7 mesi o 99.9€ per 14 mesi. A mio parere il primo pacchetto è ottimo: con soli 13 euro/mese avete la possibilità di esercitarvi in modo sistematico per l'esame per tre mesi (questo è forse l'unico neo, per la parte HSK non è possibile scegliere pacchetti più piccoli di tre mesi).

Giudizio complessivo: 95/100

Gurulu a mio parere offre il miglior sito per la preparazione online dell'esame HSK: le proposte alternative in rete sono molteplici, alcune di queste anche gratuite, ma dopo un paio d'anni spesi ad osservare le varie alternative mi sono reso conto che la qualità in Rete ha necessariamente un prezzo. Se state cercando un sussidio che possa seriamente aiutarvi alla preparazione del test HSK e non volete perdere tempo, Gurulu offre ad un prezzo molto interessante dei sussidi di ottima qualità.

 

Tutti i vocaboli del nuovo HSK 3 (pinyin + caratteri)

Imparare a scrivere tutti e 600 i vocaboli dell'HSK3 non è una passeggiata e non credo di essere arrivato neppure a metà dell'opera. In ogni caso, poichè una delle prove dell'esame prevede di scrivere un carattere a partire dal relativo pinyin, ho pensato di raccogliere tutte le parole del nuovo HSK 3 (rivisto nel 2012) e collocarle su tre pagine. La struttura delle pagine è molto semplice, un formato colonnare come quello che vedete qui sotto (carattere/pinyin)

L'idea è quella di disporre dei vocaboli in formato compatto ma di "qualità" (in particolare mi interessava per il carattere cinese un font che fosse pù vicino alla forma scritta che a quella stampata): le tre pagine le trovate qui sotto nel formato PDF, pronto per la stampa, e anche come file SVG, per coloro che volessero ingrandire/ridurre le pagine senza perdere qualità.

Seguendo la stessa struttura ho anche creato un file (PDF) che contiene i vocaboli in solo pinyin: in questo modo è possibile verificare quante delle parole si è in grado di scrivere correttamente.

I files sono i seguenti:

Vocaboli con relativo pinyin (PDF)

Vocaboli con relativo pinyin (3 file SVG)

Lista vocaboli con il solo pinyin per la verifica

Ho aggiornato la pagina delle Risorse con i link ai nuovi files.