O Instituto de Inteligência de Língua da China ASEAN constrói independentemente um corpus multilíngue

2025-09-19 08:47:50 ciência e tecnologia

O Instituto de Inteligência de Língua da China ASEAN constrói independentemente um corpus multilíngue

Nos últimos anos, com o rápido desenvolvimento de inteligência artificial e tecnologia de processamento de linguagem natural, a construção do corpus multilíngue tornou-se uma base importante para promover a comunicação entre idiomas e inovação tecnológica. O Instituto de Pesquisa da ASEAN da China (a seguir referido como o "Instituto") anunciou recentemente que construiu com sucesso um corpus multilíngue que cobre os principais idiomas dos dez países da ASEAN, com o objetivo de promover a interoperabilidade da linguagem, a disseminação cultural e a cooperação tecnológica inteligente entre os países China e Asean.

A construção deste corpus não apenas preenche a lacuna no campo dos recursos multilíngues da linguagem na China, mas também fornece suporte de dados de alta qualidade para aplicações de inteligência artificial, como tradução de máquinas, reconhecimento de fala e análise de texto. Aqui está uma visão geral dos principais recursos e dados deste corpus:

Tipos de idiomas	Escala Corpus (100 milhões de palavras)	Áreas de cobertura	Fonte de dados
chinês	50	Notícias, direito, ciência e literatura	Publicações públicas, documentos do governo
Tailandês	12	Mídia social, notícias, viagens	Fornecido por instituições de rastreamento e cooperativas de rede
vietnamita	10	Economia, Culturas, Educação	Documentos acadêmicos, mídia de notícias
malaio	8	Negócios, direito, conversas diárias	Cooperação corporativa, agência de tradução
indonésio	8	Notícias, mídia social, cinema e televisão	Conjuntos de dados públicos, rastreamento de rede

Cenários de aplicação de corpus

A construção deste corpus fornece suporte básico para aplicações em vários campos, incluindo principalmente:

1.Tradução da máquina: Por meio de corpus paralelo multilíngue de alta qualidade, o instituto treinou um modelo de tradução que suporta pares de idiomas como chinês-inglês, chinês-Tailândia e chinês-vietnam, e a precisão da tradução é significativamente melhorada.

2.Reconhecimento de voz: Os dados de voz no corpus fornecem materiais de treinamento para os sistemas de reconhecimento de fala dos países da ASEAN, ajudando a desenvolver aplicativos como assistentes de voz inteligentes e sistemas de atendimento ao cliente.

3.Recuperação de informações em linguagem cruzada: Os usuários podem pesquisar conteúdo relacionado em idiomas da ASEAN por meio de palavras -chave chinesas, o que facilita bastante a pesquisa acadêmica e a aquisição de informações comerciais.

4.Comunicação e pesquisa cultural: O conteúdo da literatura, cinema e televisão no corpus fornece aos estudiosos culturais ricos materiais analíticos e promovem trocas culturais entre os países da China e da ASEAN.

Planejamento futuro

O instituto disse que os tipos de escala e idioma do corpus serão expandidos ainda mais no futuro e planejam incluir mais pequenos idiomas da ASEAN, como birmaneses e cambojanos. Ao mesmo tempo, o Instituto cooperará com instituições e empresas acadêmicas nos países da ASEAN para promover o compartilhamento aberto de corpus e contribuir para a pesquisa global de inteligência de idiomas.

A construção deste corpus multilíngue não é apenas uma conquista importante do Instituto de Inteligência da Linguagem da China ASEAN, mas também fornece um forte apoio à interoperabilidade da linguagem e à cooperação técnica sob a iniciativa "Cinturão e Estrada". Com o avanço contínuo da tecnologia de inteligência artificial, as perspectivas de aplicativos do corpus multilíngue serão mais amplas.

Próximo artigo

Verifique os detalhes

Como otimizar seu site

Como otimizar seu site: 10 dias de tópicos importantes e um guia estruturadoNa era da explosão da informação, a otimização de sites (SEO) tornou-se a chave para melhorar o tráfego e a experiência do usuário. Este artigo combinará os tópicos mais importantes da Internet nos últimos 10 dias para fornecer a você um guia estruturado e prático de otimização de sites.1. Análise de tópicos recentes de SEO

2026-01-29 ciência e tecnologia
Verifique os detalhes

Como fazer uma múmia

Como fazer uma múmiaA mumificação era um importante ritual fúnebre na antiga civilização egípcia. Não só refletia a crença dos antigos egípcios na vida após a morte, mas também demonstrava as suas notáveis realizações na medicina, na química e na tecnologia de embalsamamento. Este artigo apresentará o processo de fabricação de múmias em detalhes e o combinará com os tópicos e conteúdos m

2026-01-26 ciência e tecnologia
Verifique os detalhes

Como criar um atalho

Como criar atalhos: tópicos de tendência e guias práticos de toda a webEntre os temas quentes da Internet nos últimos 10 dias, tecnologia e ferramentas de eficiência têm chamado muita atenção, principalmente as habilidades de criação de atalhos. Este artigo combina tópicos importantes para apresentar detalhadamente como criar atalhos em diferentes cenários e anexa dados estruturados para referência.1. In

2026-01-24 ciência e tecnologia
Verifique os detalhes

Como recuperar e-mails excluídos

Como recuperar e-mails excluídos? ——Guia abrangente e dicas práticasNo trabalho e na vida modernos, o e-mail é uma ferramenta de comunicação indispensável. No entanto, muitas vezes ocorre exclusão acidental de e-mails, especialmente quando e-mails importantes são excluídos. Como recuperá-los rapidamente tornou-se um problema para muitas pessoas. Este artigo apresentará em detalhes como recuperar e-mail

2026-01-21 ciência e tecnologia

Últimos artigos

Artigos recomendados

Como fazer uma múmia

Como fazer uma múmiaA mumificação era um importante ritual fúnebre na antiga civilização egípcia. Não só reflet

Verifique os detalhes

2026-01-26 ciência e tecnologia
Qual marca é Chocolate Bear?

Qual marca é Chocolate Bear?Recentemente, a popularidade da palavra-chave “urso de chocolate” aumentou significativ

Verifique os detalhes

2026-01-26 Moda
Como ligar o aquecimento

Como ligar o aquecimento: temas quentes e guias práticos na Internet nos últimos 10 diasÀ medida que o inverno se apr

Verifique os detalhes

2026-01-26 carro

Lendo rankings

Verifique os detalhes

Que tal a tecnologia Xi'an NSFOCUS?

A Hanzheng Street e Wuhan International Fashion Week terminou: Yunshang capacita as ruas comerciais tradicionais para se
Verifique os detalhes

Como desligar o cartão de telecomunicações

Chongqing está entre os melhores do país para muitos dados culturais e turísticosRecentemente, o Comitê de Desenvolv
Verifique os detalhes

Como atualizar o wp10
Verifique os detalhes

Como restaurar a conta após o desligamento