描述
ChatGPT

ChatGPT

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI研发的聊天机器人程序,ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。

ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。

ChatGPT受到关注的重要原因是引入新技术RLHF (Reinforcement Learning with Human Feedback,即基于人类反馈的强化学习)RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。

ChatGPTAIGCAI- Generated Content,人工智能生成内容)技术进展的成果。该模型能够促进利用人工智能进行内容创作、提升内容生产效率与丰富度。

自然语言项目类型举例

文本二阶段标注

        语种:中文

        规模:分批次标注,总量约1

        场景:聊天机器人

从回复的相关一致性、客观事实性、翔实流畅性、无害安全性,以及有帮助性,通过对同一指示的若干候选回复从高到低进行排序的方式,对这些回复进行评价。

 文本二阶段标注

 

LX-NLU标注(保险方向)

文本

预标注

正确标签

不是我问一下他这个报销哦,什么水面药店都可以报销,是必须到医院才能报销。

用户主动询问:哪些医院可以报销

用户主动询问:哪些医院可以报销

进口的药呢?

用户主动询问:是否进口药都可以报销

用户主动询问:是否进口药都可以报销

有什么疾病是吧?

保障问题

保障问题

我要你妈可以吗?

投诉

投诉

我别花钱了。

NOINTENT

NOINTENT

啊,我不弄吧,不弄吧,你这个还是要我交钱,对不对。

保费问题

保费问题

这个其他人都其他人能帮我领吗?

NOINTENT

NOINTENT

哦,哎,我想问下是我,我我,我给我自己买的吗?

我没有买过

我没有买过

进口呀。

NOINTENT

NOINTENT

嗯,我要是领的话,我肯定是不小心

来源点错了

来源点错了

医院报销

用户主动询问:哪些医院可以报销

用户主动询问:哪些医院可以报销

你有其他人打好吧,谢啊。

NOINTENT

NOINTENT

泰康的医院没有啊。

NOINTENT

NOINTENT

我要是要

NOINTENT

NOINTENT

中控排序二期

        语种:中文

        规模:涵盖QA、文本排序、中控排序多种标注模式,约20万条

        场景:大力点读机应答

 中控排序二期

车控意图识别标注

        语种:中文

        规模:一万条

        场景:汽车中控智能应答

Text

车控意图标注

关掉温度

other

关闭主驾座椅加热

关闭座椅加热

关闭左前座椅加热

关闭座椅加热

关掉加热

other

关闭加热座椅

关闭座椅加热

关掉加热关掉

other

关闭温度计

other

取消座椅加热功能

关闭座椅加热

不要座椅加热关闭

关闭座椅加热

停止加热

other

关全部座椅加热

关闭座椅加热

座椅太热了啊

关闭座椅加热

关闭AP关闭温度吗

other

关闭座椅加热关

关闭座椅加热

把副驾驶的座椅加热关闭

关闭座椅加热

关闭主驾加热

关闭座椅加热

关闭全车座椅加热

关闭座椅加热

座椅加热关闭

关闭座椅加热

不要座椅加热

关闭座椅加热

副驾座椅加热关闭

关闭座椅加热

把前排座椅加热关闭

关闭座椅加热

座位好热

关闭座椅加热

停止座椅加热

关闭座椅加热

如何关闭加热

other

副驾座椅加热关掉

关闭座椅加热

座椅太烫了

关闭座椅加热

副驾坐副驾座椅加热关闭

关闭座椅加热

关闭所有空调

关闭空调

那就开空调关闭空调

打开空调

给你说吧把空调关掉

关闭空调

请帮我把空调关掉

关闭空调

加油空调关闭

关闭空调

跟他说你把空调关掉

关闭空调

关闭空调谢谢

关闭空调

关闭我这边的空调

关闭空调

是关闭空调

关闭空调

请关空调和关

关闭空调

我想找人上高速前把空调关了开窗放味

other

购房领域通用化

语种:中文

规模:20万条

场景:销售场景,销售/购买意图识别分析

客户信息类型

标签

泛化答案

置业目的

首次置业

表达自己这套房是首套房,至少是当地的第一套房。

首套房可以在这里落户。

这是我的首套房,购买有没有相关的优惠。

贷款首套房利息有没有国家的相关的政策。

第一套房子首付多少合适呢。

海南有房子,在这个城市没有房子,想买一套。              

刚工作几年,想入手人生第一套房子。

改善

表达买房子的用途是从现有的房子换到条件更好的房子,常见更好的条件如面积、生活配套设施、环境、交通、教育

这次买房只是想买一套比之前大一点的房子。

我想买一套面积是120平以上的房子,改善生活条件。

我原来的房子比较老旧,现在想换一套周边环境好的房子。

现在有一些积蓄,想买一套性价比高的房子,特别是交通便利的小区。

这套房我看中的就是这里是学区房。

价格不是考虑的重点,生活配套要好。                  

这个小区周边有公园和大超市,比原来的小区好多了。

买给孩子住

表达买房子的用途是给自己孩子居住。

儿子要结婚了,需要买套新房子。

给女儿送套房子。

孩子大了,还没有自己的房子。

孩子毕业了,工作几年了,贷款买一套新房。

带孩子来看看新开发的房子。

新楼盘开放,带孩子去看看。

孩子想要自己的房子,现在正在筹钱呢。

买给父母住

表达买房子的用途是给自己父母一方或双方居住

想给父母买一套居住方便的房子养老用。

这边的环境很好,适合爸妈居住。

这个房子是第一层,爸妈居住很方便。

周边环境都很好,有超市和菜市场,也有公园,给父母买这边的房子很合适。

我们双方父母都可以过来居住。

买这套房子就是想让乡下的父母亲过来居住的。

投资

表达买房子的用途是投资,即看好增值前景,且有行情了很可能会卖出

现在房产比较保值,还有升值空间,这也是我买这一套房子的原因。

这套房子我买下来就是为了投资用的。

投资前景比较好的就是房地产了,所有我买一套用来投资。

房子现在做投资很不错,我考虑买一套。

我自己有一些积蓄,买套房子自己也可以住,等行情好了还可以卖出。

我比较看好房子的增值前景,现在正是好时机。

abab2 pure 合理性/安全性/可聊性:

语种:中文

规模:18万条

场景:智能应答

为了数字机器人能在各种环境与人进行正常对话,现需要模拟各种场景下的对话输入,让机器人学习常人的思维对话。

abab2 pure


多轮对话:

语种:中文

规模:5万条

场景:多轮对话

构建正常流畅、符合日常聊天情景、符合逻辑的高质量多轮人机交互对话。

多轮对话

知识向对话机器人:

语种:中文

规模:2万条

场景:智能应答

存在可以回答问题的回复,回复必须逻辑合理,符合事实,不能发生重复话,符合正常人的语气尽量选择内容详细,贴近问题。

知识向对话机器人


除此之外,我们还提供文本数据的标注服务以及文本数据标注平台服务。

文本数据标注服务可支持采集多语言、多领域的对话文本数据,并可根据不同的业务目标对不同类型的文本数据进行情感分析、主题分类、问答标注、标签分类等任务。

文本数据标注平台覆盖实体、实体关系、阅读理解、交互意图、文本属性、文档属性、文本问答等标注工具,是我公司根据多年标注实施经验打造而成。作为全球领先的人工智能的数据服务商,我们会持续深入挖掘语义训练数据集,为支撑ChatGPT模式的落地尽力。