martes, 6 de septiembre de 2016

Traductor de Google

Traductor de Google

Google Translate o "Traductor Google" es una herramienta web que permite traducir textos entre un gran número de idiomas. Si el dispositivo cuenta con micrófono, la aplicación permite el uso de reconocimiento de voz como fuente de la traducción. El resultado se puede leer en el alfabeto del idioma fuente o en el traducido. También se puede escuchar la traducción sintetizada en dispositivos que dispongan de altavoz.

Traductor de Google (del inglés Google Translate) es un servicio libre multilingüe de traducción automática estadísticaproporcionada por Google para traducir texto, voz, imágenes o video en tiempo real de un idioma a otro. Ofrece una interfaz web, interfaces móviles para iOS y Android, y una API que los desarrolladores pueden utilizar para construir las extensiones del navegador, las aplicaciones y otro software. Desde septiembre de 2016, el Traductor de Google soporta 90 idiomas en los distintos nivelesy sirve a más de 200 millones de personas diariamente. 

Características

Interfaz de web

Para algunos idiomas, Traductor de Google puede pronunciar texto traducido, resaltar las palabras y frases que corresponde en la fuente y el texto de destino, y actuar como un diccionario simple para la entrada de una sola palabra. Si se selecciona "Detectar idioma", texto en un idioma desconocido puede ser identificado.
En la interfaz web, los usuarios pueden sugerir traducciones alternativas, como por los términos técnicos, o corregir errores. Estas sugerencias están incluidas en futuras actualizaciones del proceso de traducción. Si un usuario introduce una URL en el texto original, Traductor de Google producirá un hipervínculo a una traducción automática del sitio web. Para algunos idiomas, se puede introducir texto mediante un teclado en pantallareconocimiento de escritura, o el reconocimiento de voz. Es posible ingresar búsquedas en una lengua de origen que son primero traducido a un idioma de destino que permite a uno ver e interpretar los resultados de la lengua de destino seleccionado en el idioma de origen.

Integración con el navegador

Traductor de Google está disponible en algunos navegadores como una extensión que puede traducir.
Una serie de extensiones de Firefox existe para los servicios de Google, y lo mismo para Traductor de Google, que permiten haga clic con el acceso de comandos para el servicio de traducción. También hay disponibles varios Google Gadgets que utilizan el traductor de Google para permitir integrarlo con iGoogle y otras páginas Web.
Una extensión para el navegador Chrome de Google también existe; en febrero de 2010, Traductor de Google se integró en el navegador estándar de Google Chrome para la traducción automática de la página web.

Interfaz de móvil

La aplicación es compatible con 90 idiomas y se puede traducir 37 idiomas a través de la foto, 32 a través de la voz en el modo de conversación y 27 a través de video en tiempo real en el modo de realidad aumentada.
Un 2011 Versión Modo Conversación con el apoyo temprano al traducir entre inglés y español (en las pruebas alfa). Esta interfaz en el Traductor de Google permite a los usuarios comunicarse de forma fluida con una persona cercana en otro idioma. En octubre de 2011 se amplió a 14 idiomas.
La funcionalidad 'de entrada de la cámara' permite a los usuarios tomar una fotografía de un documento, letrero, etc. Traductor de Google reconoce el texto de la imagen utilizando la tecnología de reconocimiento óptico de caracteres (ROC) y da la traducción. Entrada de la cámara no está disponible para todos los idiomas.
En enero de 2015, la aplicación ganó la capacidad de traducir el texto en tiempo real usando la cámara del dispositivo, como resultado de la adquisición de la aplicación Word Lens de Google. La velocidad y la calidad de la traducción de vídeo característica en tiempo real (realidad aumentada) se han mejorado aún más en julio de 2015 con el lanzamiento de una nueva aplicación que utiliza redes neuronales convolucionales.

Versión para Android

Traductor de Google está disponible como una aplicación de descarga gratuita para los usuarios del sistema operativo Android. La primera versión fue lanzada en enero de 2010. Funciona simplemente como la versión del navegador. Traductor de Google para Android contiene dos opciones principales: "Traducción de SMS" y "Historia".
La aplicación es compatible con 90 idiomas y la entrada de voz para 15 idiomas.Está disponible para dispositivos con Android 2.1 y superiores y se puede descargar mediante la búsqueda de "Traductor de Google" en Google Play. Fue lanzado por primera vez en enero de 2010, con una versión mejorada disponible el 12 de enero de 2011. El 14 de enero de 2015, implemento nuevas funcionalidades, en que se puede traducir cualquier idioma con solo enfocar el texto en la cámara del dispositivo móvil y también ofreciendo un modo de conversación que utiliza el comando de voz y el almacenamiento en la nube de Google para traducir el diálogo entre dos personas que hablan diferentes idiomas. 
Última versión: 3.1.0.

Versión de iOS

En agosto de 2008, Google lanzó una aplicación web Traductor de Google HTML5 para iOS para usuarios de iPhone e iPod Touch, y la aplicación de iOS fue puesto en libertad el 8 de febrero de 2011. El actual Traductor de Google aplicación es compatible con iPhoneiPad y iPod Touch actualizado para iOS 7.0 o superior. Se acepta la entrada de voz para 15 idiomas y permite la traducción de una palabra o frase en una de las más de 50 idiomas. Las traducciones se puede hablar en voz alta en 23 idiomas diferentes.
Última versión: 4.4.0 (03 de noviembre de 2015)

API

El 26 de mayo de 2011, Google anunció que el Traductor de Google API para los desarrolladores de software se había quedado obsoleto y dejaría de funcionar el 1 de diciembre de 2011, "debido a la carga económica sustancial causado por el abuso extensa." Debido a que la API se utiliza en numerosos sitios web de terceros, esta decisión llevó a algunos desarrolladores de criticar a Google y cuestionar la viabilidad del uso de las API de Google en sus productos.En respuesta a la presión pública, Google anunció el 3 de junio de 2011, que la API seguirá siendo disponible como un servicio de pago.

Metodología de traducción

Traductor de Google no se aplica reglas gramaticales, ya que sus algoritmos se basan en el análisis estadístico en lugar de análisis basado en la norma tradicional. Creador original del sistema, Franz Josef Och, ha criticado la eficacia de los algoritmos basados en reglas a favor de enfoques estadísticos. Se basa en un método llamado detraducción automática estadística, y más concretamente, en la investigación de Och que ganó el concurso de DARPA para la traducción automática de velocidad en 2003. Och era el jefe del grupo de traducción automática de Google hasta salir para unirse a la longevidad humana, Inc. en julio 2014.
Traductor de Google no se traduce de un idioma a otro (I1 → I2). En cambio, a menudo se traduce primero en Inglés y luego a la lengua de destino (I1 → EN → I2) Sin embargo, como Inglés, al igual que todas las lenguas humanas, es ambiguo y depende del contexto, esto puede causar errores de traducción. Por ejemplo, la traducción devous del Francés al Ruso da vous → you → ты O Bы/вы.31 Si Google utilizaba un lenguaje inequívoco, artificial como el intermediario, sería vous → you → Bы/вы O tu → thou → ты. Un sufijación Dicho de las palabras de ambigüedad sus diferentes significados. Por lo tanto, la publicación en Inglés, el uso de palabras ambiguas, proporcionando contexto, el uso de expresiones tales como "you all" a menudo tomar una mejor traducción de un solo paso.
Los siguientes idiomas no tienen una traducción directa Google ao de Inglés. Estas lenguas se traducen a través del lenguaje intermedio indicada (que en todo caso está estrechamente relacionado con el idioma deseado, pero más ampliamente hablado), además de a través Inglés:
Según Och, una base sólida para el desarrollo de un sistema de traducción automática estadística utilizable para un nuevo par de idiomas desde el principio consistiría en uncorpus de texto bilingüe (o una colección paralela) de más de 150-200 millones de palabras, y dos corpus monolingües cada uno de más de mil millones de palabras. Losmodelos estadísticos a partir de estos datos se utilizan entonces para traducir entre estos idiomas.
Para adquirir esta enorme cantidad de datos lingüísticos, Google utiliza documentos de las Naciones Unidas.La ONU normalmente publica los documentos en los seis idiomas oficiales de la ONU, que ha producido un gran corpus 6 idiomas.
Los representantes de Google han estado involucrados con las conferencias nacionales en Japón, donde Google ha solicitado datos bilingües de los investigadores.
Cuando el Traductor de Google genera una traducción, busca patrones en cientos de millones de documentos para ayudar a decidir sobre la mejor traducción. Mediante la detección de patrones en los documentos que ya han sido traducidas por traductores humanos, el Traductor de Google hace conjeturas inteligentes (IA) en cuanto a lo que debe ser una traducción adecuada.
Antes de octubre de 2007, para los idiomas distintos del árabechino y ruso, Traductor de Google se basó en SYSTRAN, un motor de software que todavía se utiliza por varios otros servicios de traducción en línea tales como Babel Fish (ahora difunto). Desde octubre de 2007, Traductor de Google ha utilizado patentada, tecnología propia basada en latraducción automática estadística lugar.

Limitaciones

El traductor de Google, al igual que otras herramientas de traducción automática, tiene sus limitaciones. El servicio limita el número de párrafos y la gama de los términos técnicos que se puede traducir, y si bien puede ayudar al lector a comprender el contenido general de un texto en el idioma extranjero, no siempre entregar traducciones precisas, y la mayoría de las veces se tiende a repetir literalmente la misma palabra se espera que traducir. El traductor de Google luchas para diferenciar entre los tiemposimperfectos y perfectos en lenguas románicas por lo que los actos habituales y continuos en pasado a menudo se convierten en acontecimientos históricos individuales. Aunque aparentemente pedante, esto a menudo puede conducir resultados incorrectos (a un hablante nativo de, por ejemplo, el francés y el español) que se habría evitado por un traductor humano. El conocimiento del modo subjuntivo es prácticamente inexistente.Por otra parte, la segunda persona informal (tu) se elige a menudo, sea cual sea el contexto o uso aceptado.Desde su material de referencia Inglés contiene sólo "tú" formas, es difícil de traducir a un lenguaje que tiene más.
Algunas lenguas producen mejores resultados que otros. Traductor de Google realiza bien sobre todo cuando el Inglés es el idioma de destino y el idioma de origen es de la Unión Europea debido a la prominencia de las notas traducidas Parlamento de la UE. Un análisis de 2010 indicó que el francés a la traducción Inglés es relativamente precisa,Y 2011 y 2012 análisis mostró que el Italiano al Inglés traducción es relativamente precisa también. Sin embargo, si el texto de origen es más corto, las traducciones automáticas basadas en reglas a menudo se desempeñan mejor; este efecto es particularmente evidente en chino a inglés. Mientras que las ediciones de traducciones podrán presentarse, en chino específicamente uno no es capaz de editar frases en su conjunto. En su lugar, hay que editar conjuntos veces arbitrarias de caracteres, lo que lleva a las ediciones incorrectas.
Textos escritos en griegodevanagaricirílico y escrituras árabes pueden transliterados automáticamente de equivalentes fonéticos escritos en el alfabeto latino. La versión del navegador de Traductor de Google ofrece la opción de leer fonéticamente para los japoneses a la conversión Inglés. La misma opción no está disponible en la versión de la API de pago. 
Muchos de los idiomas más populares tienen una función de audio de conversión de "texto a voz" que es capaz de leer de nuevo un texto en ese idioma, hasta un par de docenas de palabras más o menos. En el caso de las lenguas pluricéntrica, el acento depende de la región: de inglés, en las Américas, la mayor parte de la región de Asia-Pacífico y Asia Occidental el audio utiliza un acento americano general femenina, mientras que en EuropaHong KongMalasiaSingapurGuyana y todas las otras partes del mundo se utiliza una hembra acento inglés británico, a excepción de un acento Oceanía especial utilizado en AustraliaNueva Zelanda y la Isla Norfolk; para los españoles, en las Américas se utiliza un acento español de América Latina, mientras que en las otras partes del mundo se utiliza un acento español castellanoPortugués utiliza un acento São Paulo en el mundo, a excepción de Portugal, donde se utiliza su acento nativo. Algunos lenguajes hablado menos difundidas usan el código abierto eSpeak sintetizador por su discurso; la producción de una robótica, la voz incómoda que puede ser difícil de entender.

Atajos de teclado

La extensión de Chrome Keyboard Shortcuts for Google Translate permite utilizar atajos de teclado para Traductor de Google.:
  • alt[option] + A -> seleccionar todo
  • alt[option] + D -> limpiar
  • alt[option] + L -> oir (area de resultados del lado derecho)
  • alt[option] + shift + L -> oir (area de fuente del lado izquierdo)

Idiomas soportados

  • 1ª etapa
  • 2ª etapa
  • 3ª etapa
  • 4ª etapa
  • 5ª etapa (lanzado 28 de abril 2006)
    • Inglés hacia y desde árabe
  • 6ª etapa (lanzado 16 de diciembre 2006)
    • Inglés hacia y desde ruso
  • 7ª etapa (lanzado 9 de febrero 2007)
  • 8ª etapa (todos los 25 pares de idiomas utilizan el sistema de traducción automática de Google) (lanzado 22 de octubre 2007)
  • 9ª etapa
    • Inglés hacia y desde hindi
  • 10ª etapa (a partir de esta etapa, la traducción se puede hacer entre dos idiomas, utilizando Inglés como un paso intermedio, si es necesario) (lanzado 8 de mayo 2008)
  • 11ª etapa (lanzado 25 de septiembre 2008)
  • 12ª etapa (lanzado 30 de enero 2009)
  • 13ª etapa (lanzado 19 de junio 2009)
  • 14ª etapa (lanzado 24 de agosto 2009)
  • 15ª etapa (lanzado 19 de noviembre 2009)
    • La etapa Beta está terminado. Ahora los usuarios pueden optar por tener la romanización escrita para el chino, japonés, coreano, ruso, ucraniano, bielorruso, búlgaro, griego, hindi y tailandés. Para traducciones del árabe, el persa y el hindi, el usuario puede introducir una transliteración latina del texto y el texto será transcrito al script nativo para idiomas como el usuario está escribiendo. El texto ahora puede ser leído por un programa de conversión de texto a voz en inglés, italiano, francés y alemán.
  • 16ª etapa (lanzado 30 de enero 2010)
  • 17ª etapa (lanzado abril de 2010)
    • Programa del discurso lanzado en hindi y en español.
  • 18ª etapa (lanzado 5 de mayo 2010)
    • Programa del discurso lanzado en afrikaans, albanés, catalán, checo, chino (mandarín), croata, danés, eslovaco, finés, galés, griego, húngaro, indonesio, islandés, letón, macedonio, neerlandés, noruego, polaco, portugués, rumano, ruso, serbio, suajili, sueco, turco y el vietnamita (basado en eSpeak)
  • 19ª etapa (lanzado 13 de mayo 2010)
  • 20ª etapa (lanzado junio de 2010)
    • Proporciona romanización para el árabe.
  • 21ª etapa (lanzado septiembre de 2010)
    • Permite a escribir fonética para el árabe, griego, hindi, persa, ruso, serbio y urdu.
    • Latín47
  • 22ª etapa (lanzado diciembre de 2010)
    • Romanización del árabe eliminado.
    • Corrector ortográfico agregó.
    • Para algunos idiomas, Google reemplazó sintetizadores de texto a voz de voz de robot de eSpeak a las tecnologías de voz naturaleza de hablantes nativos realizados porSVOX48 (chino, checo, danés, finés, griego, húngaro, neerlandés, noruego, polaco, portugués, ruso, sueco, turco). También las viejas versiones de francés, alemán, italiano y español. Latín utiliza el mismo sintetizador como italiano.
    • Programa del discurso lanzado en árabe, japonés y coreano.
  • 23ª etapa (lanzado enero de 2011)
    • Elección de diferentes traducciones para una palabra.
  • 24ª etapa (lanzado junio de 2011)
  • 25ª etapa (lanzado julio de 2011)
    • Valoración traducción introdujo.
  • 26ª etapa (lanzado enero de 2012)
    • Neerlandés sintetizador de voz masculina sustituye con la hembra.
    • Elena por SVOX reemplazado la voz eslovaca eSpeak.
    • Transcripción del yidis agregó.
  • 27ª etapa (lanzado febrero de 2012)
    • Programa del discurso lanzado en tailandés.
    • Esperanto50
  • 28ª etapa (lanzado septiembre de 2012)
  • 29ª etapa (lanzado octubre de 2012)
    • Transcripción de lao agregó. (estado alfa)
  • 30ª etapa (lanzado octubre de 2012)
    • Nuevo programa del discurso lanzado en inglés.
  • 31ª etapa (lanzado noviembre de 2012)
    • Nuevo programa del discurso en francés, español, italiano y alemán.
  • 32ª etapa (lanzado marzo de 2013)
    • Añadió libro de frases.
  • 33ª etapa (lanzado abril de 2013)
  • 34ª etapa (lanzado mayo de 2013)
  • 35ª etapa (lanzado mayo de 2013)
    • 16 idiomas adicionales se pueden usar con la cámara de entrada: búlgaro, catalán, croata, danés, eslovaco, esloveno, estonio, finés, húngaro, indonesio, islandés, letón, lituano, noruego, rumano y sueco.
  • 36ª etapa (lanzado diciembre de 2013)
  • 37ª etapa (lanzado junio de 2014)
    • Definición de palabras añadió.
  • 38ª etapa (lanzado diciembre de 2014)
  • 39ª etapa (lanzado octubre 2015)
    • Transliteración del árabe restaurado.

Idiomas aún no admitidos por Traductor de Google 

Idiomas aún no admitidos por Traductor de Google, pero en proceso.

Licencias y componentes de código abierto


IdiomaWordNet2Licencia
AlbanésAlbanetCC-BY 3.0/GPL 3
ÁrabeArabic Wordnet
CatalánMultilingual Central RepositoryCC-BY-3.0
ChinoChinese WordnetWordnet
DanésDannetNo Wordnet
EspañolMultilingual Central RepositoryCC-BY-3.0
FinésFinnWordnetWordnet
FrancésWOLF (WOrdnet Libre du Français)CeCILL-C
GallegoMultilingual Central RepositoryCC-BY-3.0
HebreoHebrew WordnetWordnet
HindiIIT Bombay WordnetIndo Wordnet
IndonesioWordnet BahasaMIT
InglésPrinceton WordnetWordnet
ItalianoMultiWordnetCC-BY-3.0
JaponésJapanese WordnetWordnet
JavanésJavanese WordnetWordnet
MalayoWordnet BahasaMIT
NoruegoNorwegian WordnetWordnet
PersaPersian WordnetFree to Use
PolacoplWordnetWordnet
PortuguésOpenWN-PTCC-BY-SA-3.0
TailandésThai WordnetWordnet

Críticas

Poco después de lanzar el servicio de traducción, Google ganó un concurso internacional para inglés-árabe y traducción inglés-chino máquina.

Errores de traducción y rarezas

Debido a que el Traductor de Google utiliza coincidencia estadística para traducir, a menudo el texto traducido puede incluir errores aparentemente sin sentido y evidentes, a menudo intercambiando los términos comunes para términos comunes similares pero no equivalentes en el otro idioma,así como la inversión de significado de la oración. También, para el discurso, utiliza sólo francés Europea, así como el español de América Latina en todo el mundo, pero Portugal y el portugués de Brasil (Europea para translate.google.pt y brasileña para el resto de los sitios de Traductor de Google).

Traducir Comunidad

Traducir Comunidad es una plataforma que se pretende mejorar el servicio Traductor de Google. Los voluntarios pueden seleccionar hasta cinco idiomas para ayudar en la mejor traducción. Los usuarios pueden verificar frases traducidas y traducir frases en su lengua desde y hacia Inglés, ayudando a mejorar la exactitud de la traducción de las frases más raros y complejos

No hay comentarios:

Publicar un comentario