Identificación de idioma de sitio web

Esta herramienta analiza el lenguaje utilizado en una página web. Utiliza los últimos enfoques del Procesamiento de Lenguajes Naturales para hacerlo.

  

Captcha



Esta herramienta es particularmente útil para ofrecer publicidad contextual en línea o para hacer una agregación de blogs en función de sus lenguas. Por supuesto, puede ser adaptada a sus necesidades para adaptarse a sus especificaciones.

Tenga en cuenta que menos idiomas se debe diferenciar, mejor están los resultados de esta herramienta.

Por cualquier pregunta sobre este producto, usted puede usar el formulario de contacto.

Los 220 idiomas actualmente soportados son:

  1. abjaso, aceh, achuar shiwiar, afrikáans, aguaruna, akha, aimara, albanés, alemán, amahuaca, amarakaeri, amuesha-yanesha, árabe, arabela, arapaho, armenio, asháninca, ashéninka pajonal, asturiano
  2. bemba, bereber (tamazight), bielorruso (alfabetos cirílico y latino), bislama, bopurí, bora, bretón, brithenig, buginés, búlgaro
  3. candoshi-shapra, caquinte, cashibo-cacataibo, casubio, catalán, cebuano, chamorro, chayahuita, checo, chichewa, chickasaw, chinanteco (Chiltepec y Ojitlán), chin falam, chino mandarín, chokwe, chuan del norte, chuukese, córnico, croata
  4. danés, dhivehi, dinka padang
  5. edo, eslovaco, esloveno, español, esperanto, estonio, euskera
  6. feroés, fiyiano, frisón y frisón septentrional, friulano
  7. gaélico escocés, galés, gallego, garifuna, glosa, griego, guaraní, guyaratí
  8. hani, hausa, hawaiano, hebreo, hiligaynon, hindi, hmong (Qiandong Miao del norte, del sur, y hmong njua), holandés, huasteco de San Luís Potosí, huitoto murui, húngaro
  9. ibibio, ido, igbo, ilocano, indonesio, innu-aimun, interlingua, inuktitut, islandés, italiano
  10. japonés, javanés, jola-fogny, judeoespañol
  11. kanuri yerwa, kaonde, kaqchikel, klingon, konjo, kurdo
  12. lamnso, letón, limburgués, lingala, lituano, lojban, lozi, luba-kasai, luganda, luvale, luxemburgués
  13. macedonio, madurés, makonde, malayalam, malayo, malgache, maltés, mam, maorí, mapuche, maratí, marshalés, matsés, maya yucateco, micmac, minangkabau, miskito, mixteco Metlatónoc
  14. náhuatl, ndonga, nepalí, nomatsiguenga, noruego (Bokmål y Nynorsk), novial, nyamwezi, nyemba
  15. oromo, osetio, otomi
  16. páez, palauano, pampango, persa, picardo, pipil, pohnpei, polaco, portugués, provenzal, purépecha
  17. q ’eqchi, quenya, quimbundo
  18. romanche, romaní (báltico y Vlax), rumano, rundi, runyankole, ruso
  19. samareño, sami (meridional, septentrional, de Lule), sango, serbio (cirílico y alfabeto latino de Gaj), setsuana, sharanahua, shipibo, sindarin, sindhi (alfabeto árabe), sondanés, soninké, sorbia, sotho (del norte y del sur), suazi, sueco, sukuma, swahili
  20. tagalo, tahitiano, tailandés, tamil, tedim, tetun, toba, tojolabal, tongano, tok pisin, tzotzil (Chamula), turco
  21. ucraniano, umbundu, urarina, urdu, uzbeko (alfabeto latino)
  22. valón, vietnamita, volapük
  23. wayúu, wolof
  24. xhosa
  25. yagua, yao, yapese, yidis, yoruba
  26. zapoteco (Miahuatlán y Güilá), zulú