大模型持续迭代,明年有望多方面突破

12月25日,以“大模型·大未来”为主题的“2024人工智能大模型基准测试科创发展大会”在成都高新区盛大开幕。这场盛会汇聚了众多专家、学者,以及来自多个垂直行业的大模型企业和关联企业代表,共同探讨人工智能产业发展的新方向,加速人工智能大模型应用场景的落地。

在大会现场,四川语言桥信息技术有限公司的AI事业部总监李晶分享了关于大模型技术在翻译行业的巨大潜力。同时,中科曙光智能计算产品运营总监唐鹏也强调了在当前人工智能大模型百花齐放的市场环境下,算法、算力和数据三大核心要素对于人工智能发展的重要性,特别是在大模型时代,算力需求呈现出阶梯式增长。

李晶介绍了语言桥信息技术自主研发的先锋智语(Dtranx)大语言模型,这是一款专注于解决小语种翻译的准确性和行业翻译的专业性问题的模型。这款模型的应用场景广泛,包括文档翻译、图片翻译、会议翻译、实时交流翻译、网站本地化、软件本地化、视频翻译等。此外,对于更复杂的场景,如法律文件审查、医学文献、药品注册文件等翻译,先锋智语也能确保专业术语的准确性。通过自动化处理,该模型大幅缩短了翻译周期,降低了人力成本,显著提升了整体工作效率和质量。

唐鹏透露,中科曙光主要聚焦于toB和toG两大市场,并依托自主可控的算力基础,提供了自研的DTK软件栈。这款软件栈不仅兼容CUDA和ROCM,还为客户提供了广泛的受众群体。中科曙光的算力已经广泛应用于政府企业、高教科研、运营商、金融能源以及医疗等领域。

从基础大模型到能落地的行业应用,仍需要跨越多重挑战。李晶指出,高质量的数据是训练高质量模型的基础。在构建标准化、高质量的数据集时,如何确保数据的安全性和用户隐私不被侵犯,是一个巨大的挑战。此外,模型的训练和使用涉及高额硬件投入,且不同行业和企业可能存在大量定制化需求,这要求模型具有高度的灵活性和可定制性,成本控制成为阻碍大模型应用的重要因素。同时,法律法规遵从和价值观对齐也是模型应用的难点之一,如何确保模型的生成内容符合对应国家及地区的法规,与人类正确的价值观对齐,是一个关键问题。

对于未来大模型技术的发展趋势,李晶和唐鹏都持积极态度。李晶认为,到2025年,大模型有望在复杂逻辑推理和跨领域问题解决方面取得突破,推动行业智能化升级。具体来说,大模型将针对法律、金融、医疗等领域,形成特定垂直领域的高效解决方案;同时,支持跨文档分析和长期记忆机制,提升复杂任务的连续推理能力;此外,还将专业的翻译大模型集成到ERP、CRM、CMS等系统,优化自动化工作流和决策支持,为企业的全球化竞争提供更加强有力的支持。唐鹏则认为,随着技术的不断进步,大模型将持续迭代升级,并在更多行业领域实现落地应用。同时,他也指出了国产化趋势的不可逆,并预测明年将是国产算力蓬勃发展的一年,市场上将涌现出更多的机会和挑战。

红星新闻记者 俞瑶 实习记者 孙树冠

(下载红星新闻,报料有奖!)

图片

图片描述

此图片展现了大会现场的氛围,人们正在交流、讨论,展现了人工智能大模型领域的热度和活力。

发表评论

评论列表

还没有评论,快来说点什么吧~