定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638

《湖南大学:2025我们该如何看待DeepSeek——what, how, why, and next(82页).pdf》由会员分享,可在线阅读,更多相关《湖南大学:2025我们该如何看待DeepSeek——what, how, why, and next(82页).pdf(82页珍藏版)》请在薪酬报告网上搜索。
1、我们该如何看待DeepSeekwhat,how,why,and next?陈果湖南大学信息科学与工程学院教授国家超级计算长沙中心常务副主任声明:1.仅代表个人观点,不代表任何机构立场;2.面向不具备AI专业知识背景的群体,为保持易懂性简化了很多技术细节,且不求涵盖所有方面;3.主要以R1模型视角讲解,其他模型在第三大块有简要介绍;4.受个人研究领域及认知水平所限,难免有疏漏或偏颇之处,欢迎批评指正。提纲What is it:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)How to use it:我能用DeepSeek干
2、什么以小见大,掌握思维方法正确理解,打开广阔天地Why it works:DeepSeek背后的原理Transformer大模型基础DeepSeek模型的发展历程Next:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注2提纲What is it:DeepSeek是什么从ChatGPT到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)How to use it:我能用DeepSeek干什么以小见大,掌握思维方法正确理解,打开广阔天地Why it works:DeepSeek背后的原理Transformer大模型基础DeepSeek模型的发展历程Ne
3、xt:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注3从ChatGPT开始4故事从ChatGPT说起5ChatGPT的诞生在全球范围内引爆人工智能(AI)相当数量的人(圈内人、技术潮人为主)开始切身感受到AI带来的巨大冲击https:/ GPT用于聊天、对话Generative生成式,模型的输出方式Pre-trained预训练,模型的制造方法Transformer模型结构生成式人工智能(AIGC)支撑实现大语言模型(LLM)技术原理ChatGPT真正做的事:文字接龙7https:/speech.ee.ntu.edu.tw/hylee/index.phpChatGPT真正做的事:
4、文字接龙8https:/speech.ee.ntu.edu.tw/hylee/index.php输出又送回输入,不断迭代接龙输出又送回输入,不断迭代接龙ChatGPT真正做的事:文字接龙9https:/speech.ee.ntu.edu.tw/hylee/index.phpChatGPT真正做的事:文字接龙10https:/speech.ee.ntu.edu.tw/hylee/index.php这就是为啥LLM经常出现“幻觉”LLM怎么学习文字接龙?11https:/speech.ee.ntu.edu.tw/hylee/index.php人们开始相信AI会真正变革我们的生活12ChatGPT可
5、以自然对话、精准问答,生成代码、邮件、论文、小说。写一篇信创产业的研究报告 用鲁迅口吻写篇“长沙春天”的散文 用C+写一段爬虫代码 翻译 心理咨询建议 代码阅读理解和DEBUG从ChatGPT到OpenAI O系列13推理大模型开始走入视野:OpenAI o12024年9月12日,OpenAI官方宣布了OpenAI o1推理大模型。OpenAI宣称OpenAI o1大模型推理(Reasoning)能力相比较当前的大语言模型(GPT-4o)有了大幅提升。由于OpenAI o1模型的训练使用了一种新的AI训练方法,强调了“思维链”过程和强化学习的重要性,最终导致它在数学逻辑和推理方面有了大幅提升,
6、大家开始称这里有思考过程的大模型为推理大模型。14什么是推理模型15普通模型和推理模型的对比https:/ R1厉害在哪里此处仅介绍一部分,DeepSeek带来的更多的意义和启示在最后一章20DeepSeek R1的意义1.首个展示思维链过程的推理模型21DeepSeek R1的意义2.价格“屠夫”网页聊天免费曾经:o1模型的API价格为每百万输入tokens 约为15美元(约合人民币55元),每百万输出tokens 60美元(约合人民币438元)网页聊天也需要240美金/年的会员才能用22DeepSeek R1的意义3.首个开源的推理模型!下载模型,可以本地安装,本地使用!https:/ R
7、1的意义4.纯国产!技术创新!训练和推理高效5.性能领先!24DeepSeek R1的最大意义25DeepSeek R1让最前沿的大模型技术走入寻常百姓家,所有人(尤其是所有中国人)都能直接体验。7天用户破亿!这还不包括海量本地部署的用户量变带来质变!以前AI是“菁英游戏”,现在AI可以是“人民战争”!我国是这个量变(和即将到来的质变)的驱动源、主导者和聚集地!DeepSeek基本概念(用户角度)更详细的原理在第三部分介绍26在哪里能用到DeepSeek?27各种网上的服务!官方的、其他企业的还有很多,不一一列举。本地自己搭一套!https:/ is it:DeepSeek是什么从ChatGP
8、T到DeepSeek-R1,TA到底厉害在哪里?DeepSeek基本概念(用户角度)How to use it:我能用DeepSeek干什么以小见大,掌握思维方法正确理解,打开广阔天地Why it works:DeepSeek背后的原理Transformer大模型基础DeepSeek模型的发展历程Next:下一步要关注什么生态的爆发就在眼前,整个链条上哪些方面值得关注31DeepSeek功能领域一览 32DeepSeek:从入门到精通,清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室以小见大,掌握思维方法从一些案例出发,能干的远远比这多。思维方法!思维方法!思维方法!33写书34案例:给我
9、的编译原理书稿提供一个案例片段信息梳理35普通搜索,想半天关键词,自己整理各种素材DS-R1+联网搜索,自动梳理信息,并提供引用可检查考证案例:整理deepseek出来之前gpt o1的收费情况做对比数据分析36案例:分析某地公务员录用人员情况如,学历情况如何?多少是计算机相关专业的?咨询分析37案例:分析某专家研究特长,给出研究方向建议咨询写程序38案例:写一个抽签小程序做教辅案例:设计一个针对幼儿园小朋友的科普讲稿39正确理解,打开广阔天地正确理解DeepSeek的不能40DeepSeek(R1或V3)的不能还不是AGI,不能“一步到位”!需要用户自己具备一定的问题拆解能力、信息整合能力、
10、迭代调优能力41DeepSeek(R1或V3)的不能有很强的能力,但也经常出错;预载很多知识,但不知道所有的知识!利用其能力,判断其结果,改进其知识!42“尽信书不如无书”!要有判断筛选能力,擅用联网搜索和知识库!DeepSeek(R1或V3)的不能R1/V3都是语言模型,不能直接处理多模态数据(图片、视频等)!学会利用其它工具,一起来完成任务(智能体的思想源于此)4343DeepSeek(R1或V3)的不能模型都有上下文长度限制,不能塞太多东西给他!学会拆分任务,总结规律你一个对话框里的聊天记录都会塞进模型里去,一次聊天不能聊天多(一般128K tokens是目前通常的最高水平)44日新月异
11、,进展很快(重要新技术以周为单位出现)DeepSeek(R1或V3)的不能不是唯一的大模型,效果也难说一骑绝尘,其本身也不是一成不变!客观辩证地看待,积极开放地拥抱模型很多,各有所长(长上下文、多模态、逻辑推理、多语言,不同模型卖点不同)452024全球AIGC产业全景图谱及报告重磅发布-至顶网Deepseek发展历程概要-知乎对待DeepSeek等最新大模型的正确态度普通软件工具帮助掌握领域知识和技能的人,摆脱重复低级的脑力劳动帮助掌握领域知识和技能的人,摆脱一部分中级脑力劳动上一代大模型新一代大模型希望达到的目标:帮助大部分的普通人,摆脱一部分中级甚至是高级脑力劳动46对待DeepSeek