浪潮信息发布源2.0基础大模型,千亿参数全面开源

  发布时间:2025-01-17 01:19:35   作者:玩站小弟   我要评论
北京2023年11月27日 /美通社/ -- 11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模 。

北京2023年11月27日 /美通社/ -- 11月27日,浪潮浪潮信息发布"源2.0"基础大模型,信息并宣布全面开源。发布源2.0基础大模型包括1026亿、源基518亿、础大参数21亿等三种参数规模的模型模型,在编程、千亿全面推理、开源逻辑等方面展示出了先进的浪潮能力。

当前,信息大模型技术正在推动生成式人工智能产业迅猛发展,发布而基础大模型的源基关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的础大参数发展也面临着在算法、数据和算力等方面的模型诸多挑战。源2.0基础大模型则针对性地提出了新的千亿全面改进方法并获得了能力的提升。

算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。


数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。


算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。


源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。


源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。

代码开源链接

https://github.com/IEIT-Yuan/Yuan-2.0

论文链接

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

  • Tag:

相关文章

  • “一日兵变”背后的瓦格纳头子普里戈任丨智库视点

    当地时间2023年5月31日,俄罗斯符拉迪沃斯托克,瓦格纳集团领导人叶夫根尼·普里戈任出席“瓦格纳第二阵线”青年外展项目的演讲活动。 视觉中国/图)2023年6月23日,俄罗斯雇佣兵集团瓦格纳发生兵变
    2025-01-17
  • 城市生活垃圾分类有了时间表 2035年前重点城市达到国际先进水平

    住房和城乡建设部近日印发《关于加快推进部分重点城市生活垃圾分类工作的通知》,要求在3月底前,46个重点城市要出台生活垃圾分类管理实施方案或行动计划。《通知》要求,2018年3月底前,北京、天津、上海等
    2025-01-17
  • 残障儿童马术治疗项目首次进入中国马术节

    11月9日,在中国马术节项目之一——成都市第二届青少年马术技能比赛开赛前,举行了成都马术协会青少年马术心理及身体康复辅助治疗公益活动。“这次只是试点,但我们希望用马术来系统治疗残障儿童的活动,将来能推
    2025-01-17
  • 瑞典马术理疗师助阵成都马协残障青少年马术治疗

    “我非常高兴能够参与到此次残障青少年康复辅助治疗的课程示范中。”一见面,这名来自瑞典的年轻马术理疗师JesperFrom就向我们表达着他激动的心情。Jesper受邀担任“2014年成都市残障青少年马术
    2025-01-17
  • 女性申请“杰青”,年龄上限放宽至48岁

    国家自然科学基金委员会决定,将女性申请“杰青”的年龄限制由45周岁放宽至48周岁。人民视觉/图)2023年7月6日,国家自然科学基金委员会明确,从2024年起,将女性科研人员申请“杰青”的年龄限制由4
    2025-01-17
  • 香港骑手林立信中国马术巡回赛成都站超高赛夺冠

    11月9日,2014浪琴表中国马术巡回赛成都站结束了最后一天的争夺,在温江金马国际马术体育公园圆满落幕。中国香港骑手林立信获得了超高赛冠军。成都站最后一个比赛日,共进行浪琴表大奖赛145-150cm)
    2025-01-17

最新评论