Bem -vindo à visita Fusang!
Localização atual:primeira página >> ciência e tecnologia

O Instituto de Inteligência de Língua da China ASEAN constrói independentemente um corpus multilíngue

2025-09-19 08:47:50 ciência e tecnologia

O Instituto de Inteligência de Língua da China ASEAN constrói independentemente um corpus multilíngue

Nos últimos anos, com o rápido desenvolvimento de inteligência artificial e tecnologia de processamento de linguagem natural, a construção do corpus multilíngue tornou-se uma base importante para promover a comunicação entre idiomas e inovação tecnológica. O Instituto de Pesquisa da ASEAN da China (a seguir referido como o "Instituto") anunciou recentemente que construiu com sucesso um corpus multilíngue que cobre os principais idiomas dos dez países da ASEAN, com o objetivo de promover a interoperabilidade da linguagem, a disseminação cultural e a cooperação tecnológica inteligente entre os países China e Asean.

A construção deste corpus não apenas preenche a lacuna no campo dos recursos multilíngues da linguagem na China, mas também fornece suporte de dados de alta qualidade para aplicações de inteligência artificial, como tradução de máquinas, reconhecimento de fala e análise de texto. Aqui está uma visão geral dos principais recursos e dados deste corpus:

O Instituto de Inteligência de Língua da China ASEAN constrói independentemente um corpus multilíngue

Tipos de idiomasEscala Corpus (100 milhões de palavras)Áreas de coberturaFonte de dados
chinês50Notícias, direito, ciência e literaturaPublicações públicas, documentos do governo
Tailandês12Mídia social, notícias, viagensFornecido por instituições de rastreamento e cooperativas de rede
vietnamita10Economia, Culturas, EducaçãoDocumentos acadêmicos, mídia de notícias
malaio8Negócios, direito, conversas diáriasCooperação corporativa, agência de tradução
indonésio8Notícias, mídia social, cinema e televisãoConjuntos de dados públicos, rastreamento de rede

Cenários de aplicação de corpus

A construção deste corpus fornece suporte básico para aplicações em vários campos, incluindo principalmente:

1.Tradução da máquina: Por meio de corpus paralelo multilíngue de alta qualidade, o instituto treinou um modelo de tradução que suporta pares de idiomas como chinês-inglês, chinês-Tailândia e chinês-vietnam, e a precisão da tradução é significativamente melhorada.

2.Reconhecimento de voz: Os dados de voz no corpus fornecem materiais de treinamento para os sistemas de reconhecimento de fala dos países da ASEAN, ajudando a desenvolver aplicativos como assistentes de voz inteligentes e sistemas de atendimento ao cliente.

3.Recuperação de informações em linguagem cruzada: Os usuários podem pesquisar conteúdo relacionado em idiomas da ASEAN por meio de palavras -chave chinesas, o que facilita bastante a pesquisa acadêmica e a aquisição de informações comerciais.

4.Comunicação e pesquisa cultural: O conteúdo da literatura, cinema e televisão no corpus fornece aos estudiosos culturais ricos materiais analíticos e promovem trocas culturais entre os países da China e da ASEAN.

Planejamento futuro

O instituto disse que os tipos de escala e idioma do corpus serão expandidos ainda mais no futuro e planejam incluir mais pequenos idiomas da ASEAN, como birmaneses e cambojanos. Ao mesmo tempo, o Instituto cooperará com instituições e empresas acadêmicas nos países da ASEAN para promover o compartilhamento aberto de corpus e contribuir para a pesquisa global de inteligência de idiomas.

A construção deste corpus multilíngue não é apenas uma conquista importante do Instituto de Inteligência da Linguagem da China ASEAN, mas também fornece um forte apoio à interoperabilidade da linguagem e à cooperação técnica sob a iniciativa "Cinturão e Estrada". Com o avanço contínuo da tecnologia de inteligência artificial, as perspectivas de aplicativos do corpus multilíngue serão mais amplas.

Próximo artigo
  • Como alterar a senha da nuvem móvel? Tópicos populares e guias de operação na Internet nos últimos 10 diasRecentemente, com o aumento da conscientização sobre segurança de dados, a modificação de senhas na nuvem de telefones celulares tornou-se um tema quente. Muitos usuários estão preocupados em como atualizar senhas de serviços em nuvem de forma rápida e segura para evitar vazamento de informações.
    2026-01-11 ciência e tecnologia
  • Que tal o Assistente de Partição AOMEI? Tópicos populares e análises aprofundadas dos últimos 10 dias na InternetRecentemente, o AOMEI Partition Assistant tornou-se mais uma vez um tema quente no círculo tecnológico devido às suas poderosas funções de gerenciamento de disco. Este artigo combina as discussões acaloradas em toda a Internet nos últimos 10 dias para fornecer uma análise aprofundada do desemp
    2026-01-09 ciência e tecnologia
  • Como enviar dinheiro na entrega expressaCom o rápido desenvolvimento dos setores de comércio eletrônico e logística, o pagamento na entrega (COD), como método de pagamento conveniente, é preferido por muitos consumidores. Mas para os remetentes, como enviar corretamente o dinheiro na entrega com entrega expressa pode ser uma questão. Este artigo apresentará em detalhes o processo de envio, precauções e prob
    2026-01-07 ciência e tecnologia
  • Como comprar o Alibaba Cloud Computer WuyingNos últimos anos, com o rápido desenvolvimento da tecnologia de computação em nuvem, os computadores em nuvem tornaram-se gradualmente uma nova escolha para empresas e usuários individuais. O Cloud Computer lançado pela Alibaba Cloud atraiu ampla atenção por seu alto desempenho, baixo custo e conveniência. Este artigo apresentará em detalhes o método de compra, p
    2026-01-04 ciência e tecnologia
Artigos recomendados
Lendo rankings
Links amigáveis
Linha divisória