Chat with us, powered by LiveChat

Processo di sviluppo di traduzioni neurali automatiche personalizzate

Per lanciare un nuovo motore personalizzato di traduzione automatica neurale (CNMTE), Trusted Translations richiede un periodo di addestramento e setup iniziale. Qui di seguito c’è un esempio di processo di implementazione per creare di un nuovo motore NMT.

Selezione di un motore di base

Sviluppo una serie di contenuti sulla democratizzazione degli algoritmi. Tuttavia, questo concept dovrebbe essere più completo. Ad esempio, la democratizzazione delle soluzioni tecnologiche sta iniziando a rendere i motori di base stabili una buona base su cui costruire una soluzione personalizzata. Le offerte di servizi di Google, Microsoft o Amazon vi aiuteranno a fornire a motori già ben addestrati i vostri dati puliti.

Selezione dei dati e preparazione del corpus

Esistono vari approcci per la raccolta di dati di addestramento per la costruzione di un motore personalizzato.

  • Contenuto tradotto esistente:

    Il punto di partenza ideale per qualsiasi motore di traduzione neurale personalizzato è il ritrovamento e l’utilizzo di materiali precedentemente tradotto contenenti testi quanto più simili possibile a ciò che si deve tradurre. Quanto più materiale già tradotto è disponibile, più veloce ed economico sarà il processo. Se origine e destinazione non sono associati come unità di memoria di traduzione, è possibile eseguire un allineamento per ottenere il contenuto bilingue necessario per aumentare le prestazioni del motore

  • Dati monolingue esistenti:

    Se esiste una quantità sufficiente di contenuti di riferimento di destinazione, è possibile sfruttare tutto lo stile e la terminologia aggiungendo tutto questo al mix. Probabilmente, questo contenuto può essere stato sviluppato da zero dalle PMI locali e il suo valore non è secondo a nessuno. Inutile dire che la terminologia specifica del dominio o addirittura del cliente è un’ottima risorsa quando si personalizzano motori basati sulla tecnologia NMT, per i quali la terminologia è stata identificata come suo principale punto debole.

  • Creazione di un corpus specializzato da altre sorgenti:

    Oltre all’utilizzo di dati monolingue, effettuiamo ricerche web per materiali allineati quanto più possibile a ciò che deve essere inserito nel motore. Anche in questo caso, investire tempo nella ricerca delle aziende della migliore qualità paga sempre. Lo stesso vale per i dati bilingue che possono essere ottenuti dai mercati dei dati. Questi dati paralleli esterni dovranno essere ripuliti (con correzione ortografica, controllo dell’allineamento, eliminazione dei dati duplicati, etc.) prima dell’utilizzo come dati di addestramento per sistemi MT. In questo scenario è necessaria una quantità maggiore di intervento manuale rispetto ai casi in cui il cliente è in grado di fornire quantità sufficienti di materiale allineato e di alta qualità. La costruzione di un nuovo motore richiede tra le 4 e le 6 settimane.

Una volta che sempre più testo viene sottoposto a post-editing verrà creato sempre più materiale per il nuovo addestramento di alta qualità. Questo modello adattivo farà sì che la qualità del risultato del sistema migliori abbastanza rapidamente nel tempo.

Nuovo addestramento: I nuovi CNMTE migliorano con il post-editing umano

I motori personalizzati di traduzione neurale automatica possono essere sottoposti a diversi cicli di lavoro. Una configurazione piuttosto usata coinvolge l’integrazione con un processo di post-editing da parte di un professionista. Utilizzando questo processo, il risultato creato dal motore di traduzione neurale automatica viene corretto dai nostri professionisti per migliorare la qualità del testo e per riaddestrare il motore per le future traduzioni. Mentre il revisore modifica il risultato per migliorarne la qualità, il motore diventa più intelligente utilizzando un modello dinamico adattivo. Inoltre, con l’aumentare del flusso di traduzioni nel motore, questo diventa ancora più intelligente nel tempo. In altre parole, il divario qualitativo tra una traduzione umana completa e questa soluzione si riduce drasticamente, mentre i tempi e i costi di consegna si riducono notevolmente. Questi motori, secondo noi, diventeranno asset importanti e veri differenziatori sul mercato per qualsiasi cliente con queste necessità.