ChatGPT
ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI研发的聊天机器人程序,ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。
ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。
ChatGPT受到关注的重要原因是引入新技术RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)。RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。
ChatGPT是AIGC(AI- Generated Content,人工智能生成内容)技术进展的成果。该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。
自然语言项目类型举例
文本二阶段标注
• 语种:中文
• 规模:分批次标注,总量约1万
• 场景:聊天机器人
从回复的相关一致性、客观事实性、翔实流畅性、无害安全性,以及有帮助性,通过对同一指示的若干候选回复从高到低进行排序的方式,对这些回复进行评价。

LX-NLU标注(保险方向)
文本 | 预标注 | 正确标签 |
不是我问一下他这个报销哦,什么水面药店都可以报销,是必须到医院才能报销。 | 用户主动询问:哪些医院可以报销 | 用户主动询问:哪些医院可以报销 |
进口的药呢? | 用户主动询问:是否进口药都可以报销 | 用户主动询问:是否进口药都可以报销 |
有什么疾病是吧? | 保障问题 | 保障问题 |
我要你妈可以吗? | 投诉 | 投诉 |
我别花钱了。 | NOINTENT | NOINTENT |
啊,我不弄吧,不弄吧,你这个还是要我交钱,对不对。 | 保费问题 | 保费问题 |
这个其他人都其他人能帮我领吗? | NOINTENT | NOINTENT |
哦,哎,我想问下是我,我我,我给我自己买的吗? | 我没有买过 | 我没有买过 |
进口呀。 | NOINTENT | NOINTENT |
嗯,我要是领的话,我肯定是不小心 | 来源点错了 | 来源点错了 |
医院报销 | 用户主动询问:哪些医院可以报销 | 用户主动询问:哪些医院可以报销 |
你有其他人打好吧,谢啊。 | NOINTENT | NOINTENT |
泰康的医院没有啊。 | NOINTENT | NOINTENT |
我要是要 | NOINTENT | NOINTENT |
中控排序二期
• 语种:中文
• 规模:涵盖QA、文本排序、中控排序多种标注模式,约20万条
• 场景:大力点读机应答

车控意图识别标注
• 语种:中文
• 规模:一万条
• 场景:汽车中控智能应答
Text | 车控意图标注 |
关掉温度 | other |
关闭主驾座椅加热 | 关闭座椅加热 |
关闭左前座椅加热 | 关闭座椅加热 |
关掉加热 | other |
关闭加热座椅 | 关闭座椅加热 |
关掉加热关掉 | other |
关闭温度计 | other |
取消座椅加热功能 | 关闭座椅加热 |
不要座椅加热关闭 | 关闭座椅加热 |
停止加热 | other |
关全部座椅加热 | 关闭座椅加热 |
座椅太热了啊 | 关闭座椅加热 |
关闭AP关闭温度吗 | other |
关闭座椅加热关 | 关闭座椅加热 |
把副驾驶的座椅加热关闭 | 关闭座椅加热 |
关闭主驾加热 | 关闭座椅加热 |
关闭全车座椅加热 | 关闭座椅加热 |
座椅加热关闭 | 关闭座椅加热 |
不要座椅加热 | 关闭座椅加热 |
副驾座椅加热关闭 | 关闭座椅加热 |
把前排座椅加热关闭 | 关闭座椅加热 |
座位好热 | 关闭座椅加热 |
停止座椅加热 | 关闭座椅加热 |
如何关闭加热 | other |
副驾座椅加热关掉 | 关闭座椅加热 |
座椅太烫了 | 关闭座椅加热 |
副驾坐副驾座椅加热关闭 | 关闭座椅加热 |
关闭所有空调 | 关闭空调 |
那就开空调关闭空调 | 打开空调 |
给你说吧把空调关掉 | 关闭空调 |
请帮我把空调关掉 | 关闭空调 |
加油空调关闭 | 关闭空调 |
跟他说你把空调关掉 | 关闭空调 |
关闭空调谢谢 | 关闭空调 |
关闭我这边的空调 | 关闭空调 |
是关闭空调 | 关闭空调 |
请关空调和关 | 关闭空调 |
我想找人上高速前把空调关了开窗放味 | other |
购房领域通用化
语种:中文
规模:20万条
场景:销售场景,销售/购买意图识别分析
客户信息类型 | 标签 | 泛化答案 |
置业目的 | 首次置业 | 表达自己这套房是首套房,至少是当地的第一套房。 |
首套房可以在这里落户。 | ||
这是我的首套房,购买有没有相关的优惠。 | ||
贷款首套房利息有没有国家的相关的政策。 | ||
第一套房子首付多少合适呢。 | ||
海南有房子,在这个城市没有房子,想买一套。 | ||
刚工作几年,想入手人生第一套房子。 | ||
改善 | 表达买房子的用途是从现有的房子换到条件更好的房子,常见更好的条件如面积、生活配套设施、环境、交通、教育 | |
这次买房只是想买一套比之前大一点的房子。 | ||
我想买一套面积是120平以上的房子,改善生活条件。 | ||
我原来的房子比较老旧,现在想换一套周边环境好的房子。 | ||
现在有一些积蓄,想买一套性价比高的房子,特别是交通便利的小区。 | ||
这套房我看中的就是这里是学区房。 | ||
价格不是考虑的重点,生活配套要好。 | ||
这个小区周边有公园和大超市,比原来的小区好多了。 | ||
买给孩子住 | 表达买房子的用途是给自己孩子居住。 | |
儿子要结婚了,需要买套新房子。 | ||
给女儿送套房子。 | ||
孩子大了,还没有自己的房子。 | ||
孩子毕业了,工作几年了,贷款买一套新房。 | ||
带孩子来看看新开发的房子。 | ||
新楼盘开放,带孩子去看看。 | ||
孩子想要自己的房子,现在正在筹钱呢。 | ||
买给父母住 | 表达买房子的用途是给自己父母一方或双方居住 | |
想给父母买一套居住方便的房子养老用。 | ||
这边的环境很好,适合爸妈居住。 | ||
这个房子是第一层,爸妈居住很方便。 | ||
周边环境都很好,有超市和菜市场,也有公园,给父母买这边的房子很合适。 | ||
我们双方父母都可以过来居住。 | ||
买这套房子就是想让乡下的父母亲过来居住的。 | ||
投资 | 表达买房子的用途是投资,即看好增值前景,且有行情了很可能会卖出 | |
现在房产比较保值,还有升值空间,这也是我买这一套房子的原因。 | ||
这套房子我买下来就是为了投资用的。 | ||
投资前景比较好的就是房地产了,所有我买一套用来投资。 | ||
房子现在做投资很不错,我考虑买一套。 | ||
我自己有一些积蓄,买套房子自己也可以住,等行情好了还可以卖出。 | ||
我比较看好房子的增值前景,现在正是好时机。 |
abab2 pure 合理性/安全性/可聊性:
语种:中文
规模:18万条
场景:智能应答
为了数字机器人能在各种环境与人进行正常对话,现需要模拟各种场景下的对话输入,让机器人学习常人的思维对话。

多轮对话:
语种:中文
规模:5万条
场景:多轮对话
构建正常流畅、符合日常聊天情景、符合逻辑的高质量多轮人机交互对话。

知识向对话机器人:
语种:中文
规模:2万条
场景:智能应答
存在可以回答问题的回复,回复必须逻辑合理,符合事实,不能发生重复话,符合正常人的语气尽量选择内容详细,贴近问题。

除此之外,我们还提供文本数据的标注服务以及文本数据标注平台服务。
文本数据标注服务可支持采集多语言、多领域的对话文本数据,并可根据不同的业务目标对不同类型的文本数据进行情感分析、主题分类、问答标注、标签分类等任务。
文本数据标注平台覆盖实体、实体关系、阅读理解、交互意图、文本属性、文档属性、文本问答等标注工具,是我公司根据多年标注实施经验打造而成。作为全球领先的人工智能的数据服务商,我们会持续深入挖掘语义训练数据集,为支撑ChatGPT模式的落地尽力。