这种延迟的纳入凸显了非西方语言在获得 等全球标准认可方面所面临的挑战。截至.版该版本涵盖了种文字和近万个字符而全球共有,余种语言。展望未来确保和相关标准中包含多种语言对于促进语言多样性和在大语言模型 等新兴技术中提供全面的语言支持至关重要。
甚至美国参议员也认识到“” 与其他语言的不平衡年月日美国参议员在与首席执行官山姆·奥特曼mm举行的参议院人工智能听证会上表达了他的担忧视频文字记录参议员亚历克斯·帕迪拉“现在随着语言模型变得越来越普遍我想确保重点关注确保不同人口群体的公平待遇。
我的理解是大多数评估和减轻公平的关注或投 越南 whatsapp 数据 资相对较少。我们以前也见过这个问题。我会告诉你我为什么提出这个问题。例如社交媒体公司没有对其非英语语言的内容审核工具和资源进行充分投资。
我分享这一点不仅是出于对非美国用户的担忧而且许多美国用户在交流时更喜欢英语以外的语言。因此我非常担心社交媒体在人工智能工具和应用程序中重蹈覆辙。问m先生和Mtmy女士和M如何确保他们在大型语言模型中的语言和文化包容性是否是您产品开发的重点领域”令人遗憾的是参议员帕迪拉从他想要缓和非英语语言的立场出发因此询问htT对其他语言的支持。
山姆·奥特曼我们认为这非常重要。其中一个例子是我们与冰岛政府合作以确保他们的语言被纳入我们的模型中。冰岛语是一种使用人数较少的语言与互联网上许多代表性语言相比使用人数较少。我们已经进行过许多类似的对话。
我期待与许多资源较少的语言建立类似的合作伙伴关系将它们纳入我们的模型。T-与我们之前的模型不同之前的模型擅长英语而对其他语言则不太擅长。现在T-在大量语言方面表现相当不错。你可以在按使用者数量排名的列表中往后看仍然可以获得良好的表现。