伯乐Bole

人力资源

多模态语言模型

专注于人力资源行业,超15亿垂直内容的训练,在人力场景下的文本生成、文本分类、情感识别、摘要等任务中,可输出更为精准的内容。同时,该模型在商业营销、办公等场景下亦表现优秀,只需少量训练集,即可定制企业私有的语言模型。

技术要点

知识增强的高质量

NLP

模型

  • 多模态图谱知识增强
    与知识图谱中多模态信息相融合,借由其中所蕴涵的海量知识对模型生成的文本在事理性、逻辑性、真实性等方面的表现进行增强
  • 预训练语言模型
    符合pre-train标准,在海量数据集上充分的训练得到预训练语言模型,之后可通过fine-tune方式结合用户提供的特异化语料快速获取满足用户需求的上游应用。
  • 基于语言学的知识增强
    引入SRP(语义角色预测)预训练语言任务,使得模型在预训练阶段能够捕捉到更多的语义语法层面知识。
  • 编码增强
    采用词编码策略,使模型在编码层的处理更符合中国人表述习惯。同时还使用token的相对位置编码,使模型在长文本的情况下发挥更加稳定。
  • 安全、可靠、高质量训练集
    投入了大量的人力对原始语料进行手动处理,剔除掉语意不明、语法混乱、夹杂错字等问题的低质量语料。除此之外,还对语料中潜在的个人信息等敏感数据进行过滤处理。

模型性能

多场景 高精度 强逻辑性

  • 小样本数据高精度训练结果
    基于超15亿数据预训练后的模型,用户只需投入小规模人力资源场景的数据进行训练,即可得到精确度较高的生成结果。
  • 知识增强提升内在逻辑性
    通过RFKL范式下的融合网络,模型将经过知识图谱推理后的向量融入预训练语言模型的推理过程,并进行文本生成,使得生成内容更具内在逻辑性。
    查看RFKL范式 >>
  • 良好的多场景任务适应性
    依靠RFKL范式构建的人力资源多模态语言模型,内含丰富的行业业务知识,可以支持多种行业场景下,不同的模型任务。
    查看RFKL范式 >>

任务场景

NLP

任务场景的良好迁移性

    目前已为

    2000W+

    位用户提供简历内容创作和应用服务

    下载模型