设为首页
收藏本站
开启辅助访问
切换到窄版
登录
立即注册
快捷导航
发布信息
搜索
搜索
门户
Portal
论坛
BBS
导读
Guide
群组
Group
官方论坛
盲盒交友
积分充值
超聚热榜
社群大全
本版
文章
帖子
群组
用户
哆啦超聚
»
论坛
›
内容分享
›
热点资讯
›
寻找癌症、抑郁症最优治疗策略,ChatGPT 表现如何? ...
返回列表
发新帖
寻找癌症、抑郁症最优治疗策略,ChatGPT 表现如何?
[复制链接]
2076
|
0
|
2023-6-7 08:07:06
|
显示全部楼层
|
阅读模式
都说医疗、金融等专业领域的语料数据稀缺,制约大模型 AI 发展,能不能让两个 ChatGPT 对聊,聊出点数据?近日,天桥脑科学研究院(TCCI)主办 AI For Brain Science 系列会议第二期 " 面向 AI 模型的数据生成方法及其对医疗领域的启示 "。在上海交通大学计算机科学与工程系副教授吴梦玥主持下,青年科学家分享了关于破解大规模语言模型数据瓶颈的看法和实践。
" 知识蒸馏 " 与快速构建专属 GPT
国际上一项研究评估指出,ChatGPT 回答癌症相关问题的水平已经与美国国家癌症研究所的官方回答持平。
然而,ChatGPT 只能通过受限的 API 进行访问。涉及到个人医疗,人们也普遍不希望将个人隐私信息分享给第三方公司。
针对这样的难题,加州大学圣迭戈分校博士生许灿文和中山大学团队的合作者提出了一种能自动生成高质量多轮聊天语料库的流程,利用 ChatGPT 与其自身进行对话,生成对话数据,再基于产生的对话数据调优、增强开源的大型语言模型 LLaMA。他们从而获得了高质量的专属模型 " 白泽 ",并在数天前推出 2.0 版本。这个名字的灵感来源是中国古代传说中的一种神兽," 能言语,达知万物之情 "。
许灿文说,白泽在这个过程中并没有学会新的知识,只是提取了大模型中的特定数据,并且保留了 ChatGPT 分点作答、拒绝回答等强大的语言能力。这在专业上被比喻为一种 " 蒸馏 "。他们进一步提出了反馈自蒸馏的概念,即利用 ChatGPT 当教官,对白泽回答的结果进行评分排序,从而进一步提高白泽模型的性能。
许灿文认为,白泽通过自动化的 " 知识蒸馏 ",在特定领域达到 ChatGPT 的能力,成本却远低于 ChatGPT,兼具经济意义和实用意义。
在医疗领域,本地化或私有化建构的模型将有利于消除隐私顾虑,辅助患者诊疗。
未来也许每个人都将有自己的专属 AI 助手。
数据生成新策:大模型优化医疗文本挖掘
ChatGPT 具有创造性的写作能力,在医疗、金融、法律等标注数据很少的领域以及知识密集型领域表现出色。然而,具体到医疗文本挖掘,他们发现将 ChatGPT 直接应用大型模型处理医疗文本的下游任务,表现并不总是优秀。
莱斯大学博士生唐瑞祥和合作者提出了一种新策略:利用大型模型生成大量医疗数据,再通过小型模型对这些数据进行训练。实验结果显示,相较直接利用大型模型执行下游任务,这一新策略能取得更出色的效果,同时因为模型数据在本地,也大幅降低了潜在的隐私风险。
他们进一步指出,随着开源大模型数量的增加和大模型能力提升,其产生的文本数据与人类产生的文本数据的差别将越来越小,能否有效检测出数据是不是 GPT 生成的,将影响到广大用户对大模型 AI 的信任度。
大模型时代的数据生成有什么不一样?
那么,在没有 GPT 的时代,科学家们如何解决数据稀缺难题?大模型又带来了哪些新趋势?
上海交通大学博士生曹瑞升谈到,深度学习本质上是一种找出从输入 x 到输出 y 的映射过程,所以需要大量的 ( x, y ) 数据对来训练。在医疗这样不容易获得大量真实数据的领域,就需要人为生成更多的 ( x, y ) 数据对。
展望未来,曹瑞升总结了数据生成在大模型时代的几大新趋势。
首先是构建更通用的模型,以确保其能应用于多样化任务。其次是从特定任务出发,进一步精细化地处理。例如,在医疗领域,甚至可以针对特定类型的抑郁症进行专业化的任务处理,提供更精准个性化的解决方案。
最后,数据生成和模型训练的过程将从分离走向融合,而为了保证数据质量的硬性过滤也将逐渐被软性控制所取代。
作者:唐闻佳
编辑:唐闻佳
责任编辑:姜澎
* 文汇独家稿件,转载请注明出处。
来源网址:http://www.myzaker.com/article/647800bc8e9f0939133a8fac
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
字煮剪策
1
主题
0
回帖
36
积分
新手上路
新手上路, 积分 36, 距离下一级还需 14 积分
新手上路, 积分 36, 距离下一级还需 14 积分
积分
36
加好友
发消息
回复楼主
返回列表
热点资讯
趣味搞笑
美景美图
心灵之窗
婚恋交友
影视动漫
图文推荐
ChatGPT 能写长篇小说了,ETH 提出 RecurrentGPT 实现交互式超长文本生成
2023-06-07
苹果 Vision Pro 和 ChatGPT4,开启了「智力盈余」时代
2023-06-07
ChatGPT 推出 App 版本,只是“新瓶装旧酒”?
2023-06-07
佰维存储:公司产品未涉及ChatGPT等人工智能领域
2023-06-07
苹果发 XR 头显 Vision Pro;郭明錤:投资人更关心苹果 ChatGPT;OpenAI 访问量突破
2023-06-07
热门排行
1
海清自曝暂退影视圈内幕!得怪病无药可治剧痛难忍,隐婚多年老公身份曝光
2
70岁自驾旅游阿姨在老挝过春节:61岁考驾照,终身未婚,看山水能忘记人生的不如意
3
朱宪民:我拍了很多这个时代马上要消失的东西
4
男子在无人机上发现大白鲨后拯救了数百名游泳者
5
《湖南卫视芒果TV元宵喜乐会》节目单来了,民间达人展示奇招绝活
6
俄罗斯任命新任中央军区司令!曾指挥马里乌波尔战斗,还被传“阵亡”
7
自驾电动车回家过年:不敢开空调,充电就像“开盲盒”
8
法治日报:老年人就业不算“劳动者”算什么?