• 首页 >  人工智能 >  AI产业
  • 清华大学:2025年AIGC发展研究报告3.0版(187页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《清华大学:2025年AIGC发展研究报告3.0版(187页).pdf》由会员分享,可在线阅读,更多相关《清华大学:2025年AIGC发展研究报告3.0版(187页).pdf(187页珍藏版)》请在薪酬报告网上搜索。

    1、AIGCAIGC发展研究发展研究清华大学清华大学新闻与传播学院新媒体研究中心新闻与传播学院新媒体研究中心人工智能学院人工智能学院双聘教授 新媒沈阳 团队 2024年12月AIGCAIGC发展研究报告发展研究报告3.03.0解读解读截止截止时间为时间为20242024年年1212月份月份内容聚焦于内容聚焦于DeepSeekDeepSeek“以外的世界以外的世界”在在Grok3Grok3和和GPP4.5GPP4.5发布之后发布之后我们将推出我们将推出AIGCAIGC发展研究报告发展研究报告4.04.0获取更多PPT资源,请关注“清新研究”二维码观看完整视频讲解,请关注“新媒沈阳”视频号团队简介团队

    2、简介沈阳为清华大学新闻学院/人工智能学院教授、博导,清华大学新闻学院元宇宙文化实验室主任,清华大学新闻学院新媒体研究中心主任。从事多个教学科研领域,包括新闻传播学、计算机科学、信息管理学、医学。领导学术研究团队近40人。指导AI元宇宙和机器人两个产业团队。团队已有众多大模型产业化和AIGC实施案例,有需要可留言联系。团队坚持:整体主义的跨学科整合力,实证主义的实践导向,社会建构的产学研结合,进步主义的先锋探索精神,科学服务于大众的社会责任。邮箱:;微博:新媒沈阳元宇宙元宇宙 大模型产业化大模型产业化大数据大数据新媒体与新媒体与网络舆论网络舆论AIAI诊疗诊疗AIAI文艺文艺六六大大研研究究方方

    3、向向新媒沈阳新媒沈阳元宇宙元宇宙/虚拟数字人虚拟数字人/大数据大数据/AI /AI 系列研究系列研究新媒体系列报告2015年开始VR的新浪潮虚拟数字人发展研究报告3.0虚拟数字人发展研究报告1.0大数据/AI/5G生态报告5G下一代风口:AR20222021202020192017201620152007虚拟社区与虚拟时空隧道虚拟数字人发展研究报告2.0虚拟数字人系列虚拟数字人系列溯源应用与发展产业发展与技术标准社会价值与风险治理52023元宇宙发展研究报告2.0版元宇宙发展研究报告3.0版韩国元宇宙动态研究报告时空智能发展研究报告1.0数字藏品发展研究报告1.0元宇宙发展研究报告1.0版元宇

    4、宙系列元宇宙系列元宇宙发展研究报告4.0新媒体发展研究报告9.0AIGC发展研究报告2.0AIGC发展研究报告1.0人形机器人发展研究大语言模型综合性能评估报告一一AI AI 哲学哲学哲思问道:思辨革新哲思问道:思辨革新 微调经典微调经典主题主题经典哲学理论经典哲学理论AIAI引发变化引发变化怀 疑 论笛卡尔笛卡尔“我思故我在我思故我在”AIAI思考所带来的怀疑论危机:思考所带来的怀疑论危机:OpenAI o1的推理能力是否意味着“思维”?AI的存在挑战了笛卡尔的怀疑论,促使我们重新审视“思维”与“存在”的关系。主体间性胡塞尔胡塞尔“主体间性主体间性”AIAI作为作为“具备主体间性的主体具备主

    5、体间性的主体”:AI的训练文本由多主体提供,使其似乎具备某种“主体间性”。但它究竟是“具备主体间性的主体”,还是“主体性之集合”?或许,AI的主体间性不过是人类意图的映射,而非真正的主体性。他者经验“他者经验他者经验”的可获取的可获取AIAI与与“他者经验他者经验”的议题:的议题:AI的存在使得他者经验的获取成为可能,这挑战了胡塞尔认为他者经验无法被完全获取的观点。AI甚至可能成为他者经验的载体,研究者需要重新审视主观经验与客观信息的融合。儒家之信儒家儒家“信信”的思想的思想AIAI幻觉对幻觉对“信信”的冲击:的冲击:AI虚假信息的出现使传统儒家五德思想中的“信”重新获得重视,人们意识到“无信

    6、”对日常生活带来的痛苦和不便。回归对话苏格拉底和孔子对于对话苏格拉底和孔子对于对话的偏爱的偏爱AIAI对对话的依赖:对对话的依赖:AI依赖对话形式促进交流,类似于苏格拉底和孔子的教学方式。然而,AI的对话模式也促使我们重新审视理性、知识本质和人际互动方式,挑战了传统对话的深度与真实性。历史唯物马克思的社会阶段理论马克思的社会阶段理论AIAI与实现共产主义的曙光:与实现共产主义的曙光:AIGC大幅提高了社会生产力,为实现更高级社会形态提供了技术支持,这在某种程度上印证了马克思关于社会阶段演进的预言。AI的发展为技术革命助力,推动了社会向更理想形态的迈进。技术问询海德格尔对技术的批判海德格尔对技术

    7、的批判形而上的技术与思想的重塑:形而上的技术与思想的重塑:技术不仅是工具,更是一种形而上的力量,深刻改变了人类理解世界的方式。AI的出现加剧了这一影响,使人类思维逐渐依赖技术逻辑。这种重新审视表明,技术不仅在塑造认知方式,还在重构对自身和现实的理解。环形监狱福柯对权力的批判福柯对权力的批判AIAI本身便是一个具象化的环形监狱:本身便是一个具象化的环形监狱:AI的应用使用户既是“监视者”,也是“被监视者”,这强化了福柯对权力结构的批判。AI的存在挑战了对隐私、自我监控和权力关系的理解,促使我们重新审视技术对个人自由和社会控制的影响。天人智一:融通物我天人智一:融通物我 和谐共生和谐共生 中国古典

    8、哲学中的“天人合一”理念强调人与自然的深层和谐,将心或灵魂视为个体与宇宙沟通的纽带,展现内在精神与外在自然的紧密联结。随着人工智能时代的到来,这一理念逐步向“天人智一”转变,即通过AI技术延展延展人类智慧,攻克诸如意识起源、历史谜题等人类难题,大幅提升生产效率,从而解放人类劳动力,赋予更多时间与空间去追求个人的诗意生活,实现人与自然、技术的全面和谐。“天”不仅象征自然环境,还代表更广泛的宇宙秩序。被视为至高的存在,其运作规律是人类应当遵循和学习的。“天人合一”强调人是自然的一部分,能理解并与自然和谐共处。人的行为和生活方式应与自然法则一致,以实现内外和谐。作为不同于人类和自然的第三方,人工智能

    9、的介入帮助人类提升生产力,并更深入地理解世界与自身,进而实现人、自然和技术的和谐共处。天(自然)天(自然)人(人类)人(人类)智(人工智能)智(人工智能)人工智能同人类灵魂融合为一,进而极大的解放人类生产力,提升工作效率。借此,人类得以更深入理解世界,实现人、机、自然和谐共处。一(三者共生)一(三者共生)问行合一:主动深思问行合一:主动深思 创新执行创新执行 实践性:实践性:“行”是将知识和信息转化为实际行动的过程,它强调实践和应用。目标导向:目标导向:行动是为了实现特定的目标或解决问题,具有明确的方向性。动态调整:动态调整:行动过程中需要根据实际情况进行灵活调整,以达到最佳效果。行行探索性:

    10、探索性:“问”体现了对知识的主动探求,尤其是在使用AI时,用户通过提问来挖掘数据、寻找答案或解决问题。互动性:互动性:提问是用户与AI系统进行交互的一种方式,通过提问,用户可以引导AI提供更符合需求的信息。开放性:开放性:好的问题往往是开放性的,能够激发新的思考和发现,不局限于已有的知识和观点。问问在人工智能语境下,“问行合一”是指一种高效的人机交互理念,它融合了深度查询与精准执行。其中,“问”代表对未知或复杂问题的深度挖掘与探索,体现了人类对知识与智慧的追求;“行”则代表基于AI分析结果的迅速且精准的行动实施,彰显了人类对于机器智能输出的高效利用与转化。此理念倡导在AI技术的辅助下,人类应持

    11、续深化提问的质量与深度,充分利用AI的数据挖掘与模式识别能力,探寻数据与知识背后的深层逻辑与规律。同时,人类需对AI的输出进行精准解读,并迅速转化为具有实际操作性的策略与行动,以实现人机协同的最大化效益。认知融合,思维拓展,全景理解认知融合,思维拓展,全景理解虚实连断虚实连断性(天)性(天)身心流固身心流固性(人)性(人)觉识拟创觉识拟创性(智)性(智)虚实存在论:虚实存在论:互融交汇互融交汇 流转不息流转不息镜像进化论:逆序生成镜像进化论:逆序生成 模拟模拟宇宙宇宙人类世界人类世界模拟意识:模拟意识:创建一个能够进行自我反思、决策并具备学习能力的系统AIAI“主导主导”的世界的世界模拟生命:

    12、模拟生命:模拟生命体的复杂性,包括自我复制、进化和适应环境的能力模拟元宇宙:模拟元宇宙:模拟宇宙的物理法则、结构和演化历史,宏观层面反映宇宙起源嵌嵌套套模模拟拟理理论论内外认知论:认知外赋内外认知论:认知外赋 决策决策自持自持认知融合时代认知融合时代内化内化内联内联 内卷内卷外包外包外挂外挂外延外延如果将人类以往的一切认知定义为“人类普遍认知”(Human General Cognition),而将AI产生的认知定义为“AI生成认知”(Artificial Intelligence Generated Cognition),那么我们当前正处于一个重要的临界点。认知外包的同时,决策需要内源化认知

    13、外包的同时,决策需要内源化提示范畴论:任意为根提示范畴论:任意为根 潜在为机潜在为机潜在有潜在有AIAI可能给出可能给出之结论之结论的集合的集合任意有任意有多元多元宇宙上一切可宇宙上一切可能的知识或信息能的知识或信息可以有可以有AIAI交流时实际给出交流时实际给出的结论的结论实际有实际有AIAI给出的作品在现给出的作品在现实世界被创造实世界被创造0101语言哲学、自然语言、检索语言、编语言哲学、自然语言、检索语言、编程语言、程语言、AIAI原理原理0202问、改、创、优问、改、创、优0303提示的边界就是想象的提示的边界就是想象的边界边界0404单一模态到单一模态到多模态多模态AIAI三用三用

    14、:重构万象:重构万象 感知感知超凡超凡创新与灵感源泉创新与灵感源泉心理与情感体验心理与情感体验教育与训练教育与训练AIAI再创再创AIAI拟真拟真AIAI异感异感 探索与实验探索与实验 社会与文化批判社会与文化批判 未来预演未来预演快思慢想:效能兼顾快思慢想:效能兼顾 全局视野全局视野概率预测(快速反应模型,如概率预测(快速反应模型,如ChatGPT 4oChatGPT 4o)链式推理链式推理(慢速思考模型,如慢速思考模型,如OpenAI o1)OpenAI o1)性能表现响应速度快,算力成本低慢速思考,算力成本高运算原理基于概率预测概率预测,通过大量数据训练来快速预测预测可能的答案基于链式思

    15、维链式思维(Chain-of-Thought),逐步推理推理问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况,实时做出决策创造力限于模式识别和优化,缺乏真正的创新能力能够生成新的创意和解决方案,具备创新能力人机互动能力按照预设脚本响应,较难理解人类情感和意图更自然地与人互动,理解复杂情感和意图问题解决能力擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题,提供创造性的解决方案伦理问题作为受控工具,几乎没有伦理问题引发自主性和控制问题的伦理讨论CoTCoT链式思维链式思维的出现将大模型分为的出现将大模型分为了了两类:两类:“概率预测(快速反应)概率预测(快速反应

    16、)”模型和模型和“链式推理(慢速思考)链式推理(慢速思考)”模型。模型。前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型,实现最佳效果。适的模型,实现最佳效果。两者均以“AI自动化程度”为线索,但“L1-L5阶段”更为贴近该线索,强调AI在逐步减少人类干预的过程中实现完全自主,聚焦自动化发展的渐进演变。相较之下,Altman的AGI五阶段更具实践导向。AIAI自动化自动化L1-L5L1-L5:渐进提升:渐进提升 全能自理全能自理对比维度对比维度

    17、Sam AltmanSam Altman的的AGIAGI五阶段五阶段AIAI自动化自动化L1-L5L1-L5异同点异同点辅助性阶段辅助性阶段阶段1:狭义AI,AI在特定任务中提供辅助。L1:辅助自动化,AI简化流程,提供工具支持。两者均以AI提供辅助为基础,帮助人类提高效率。部分自主阶段部分自主阶段阶段2-3:AI在复杂任务中提供帮助,需人类监督。L2-L3:AI部分自动化,能独立生成内容但需人类设定条件。均强调AI在逐步减少人为干预的过程中具备部分自主能力。高级自主阶段高级自主阶段阶段4:通用AGI,AI具备高度自主性,解决广泛任务。L4:高级自动化,AI独立创作,有一定创新能力。都体现了A

    18、I的自主性,但Altman更关注形成可落地的应用节点。完全自主阶段完全自主阶段阶段5:超级AGI,AI超越人类,具备自我反思与创新能力。L5:完全自动化,AI超越人类水平,具备自我反思与创新能力。两者都预见AI超越人类,但Altman更侧重于实践,L5侧重自动化的程度。部 分 自 动 化部 分 自 动 化条 件 自 动 化条 件 自 动 化高 级 自 动 化高 级 自 动 化辅 助 自 动 化辅 助 自 动 化完 全 自 动 化完 全 自 动 化AgentsAgentsOrganizationsOrganizationsChatbotsChatbotsReasonersReasonersInn

    19、ovatorsInnovators生成边界与思维滞环:生成边界与思维滞环:僵局显现僵局显现 破题之道破题之道思维滞环可能出现原因:思维滞环可能出现原因:1.1.重复内容:重复内容:AI生成的回答重复相似,缺乏新意2.2.推理不变:推理不变:即使改变提问,AI的逻辑仍然不变,无法提供不同的结论3.3.回答表面化:回答表面化:AI只给出浅显的回答,无法深入分析4.4.语言模式相同:语言模式相同:输出的句式和结构没有变化,显得单调5.5.忽略反馈:忽略反馈:AI无法根据用户的反馈调整回答如何判定触及生成边界:如何判定触及生成边界:1.1.指令执行分析:指令执行分析:检查AI是否按要求添加或修改内容2

    20、.2.回答多样性测量:回答多样性测量:评估AI回答的新信息量和多样性3.3.上下文适应测试:上下文适应测试:观察AI能否根据新上下文调整回答4.4.情感语气变化检测:情感语气变化检测:检测AI回答的情感和语气是否变化5.5.逻辑推理验证:逻辑推理验证:观察AI在条件变化时是否调整推理思维滞环现象解决思路:思维滞环现象解决思路:1.1.调整提问:调整提问:改变问题方式,引导AI生成不同的回答2.2.优化训练:优化训练:使用更多样的训练数据和算法,提高AI的多样性3.3.提供外部信息:提供外部信息:引入新的知识库,帮助AI生成新内容4.4.调整模型参数:调整模型参数:优化训练参数,避免模型陷入局部

    21、最优5.5.增加反馈回路:增加反馈回路:通过即时反馈修正AI的推理过程生成边界生成边界指AI模型在理解、创造与创新方面的能力极限,体现了其认知能力的实际限制认知能力的实际限制。当用户的交互触及或超越这一边界时,AI无法突破自身局限,进而引发思维滞环现象思维滞环现象。该现象表现为AI在多轮对话中重复内容、缺乏新意或无法满足用户的新增需求。这一现象反映了AI模型在复杂互动中的认知限制,影响了其响应的多样性和实用性。未来学科划分:共生拓展未来学科划分:共生拓展 智启新程智启新程人类如何驾驭驾驭人工智能/机器。实现更高效、更和谐的协作,提升人类的生活质量和社会效率,提高生产效率优化和提升提升人工智能的

    22、能力。主要涉及AI的技术创新与发展,涵盖基础理论、应用技术以及未来可能的智能演进人工智能科学人工智能科学人机共生科学人机共生科学 人类增强技术:提升人类能力的研究。人机交互设计:优化人与机器的互动。情感计算研究:AI识别和表达情感。社会共生理论:探索AI融入社会方式。具身认知科学:研究身体对认知影响。健康科技创新:技术促进健康与康复。媒介共生学:AI在媒体中的应用。机器学习算法:研究自我学习算法。自然语言处理:AI理解和生成语言。计算机视觉:AI解析图像和视频。智能机器人学:开发智能机器人系统。生成式AI技术:AI生成内容研究。通用人工智能:探索全面智能系统。AI伦理安全:研究AI的伦理与安全

    23、。二二国内外大模型国内外大模型 基座基座升级:快速演进升级:快速演进 未来未来可期可期032024.9.122024.2.152022.11.30第二次进步第二次进步 视频生成领视频生成领域域从静态图像生成向动态视频创作推进,从认识二维平面到模仿三维世界SoraSora使得AI从“图像绘制者”提升为“视频创作者”第一次进步第一次进步 文本生成领文本生成领域域从判断识别文本向理解生成文字发展,从单一任务向通用智能迈进,OpenAI OpenAI 掀起掀起AIGCAIGC革命革命ChatGPTChatGPT使得AI从“特种模型”提升为“通用基座”第三次进步第三次进步 逻辑推理领逻辑推理领域域从“模

    24、仿智能”向“推理智能”演进,从模仿人的常识到模仿人的思维OpenAI oOpenAI o1 1使AI从“模仿者”提升为“慢思考者”生成机制:语料预学生成机制:语料预学 推理输出推理输出具体框架:以具体框架:以“我喜欢吃苹果。我喜欢吃苹果。”为为例例语料预训练语料预训练模型训练模型训练假设我们有一个句子我喜欢吃苹果。作为我们训练语料的一部分。在训练期间,模型将尝试学习句子的模式和结构。GPT-4使用了一种叫做 多头注意多头注意力力 的技术,这允许模型在不同的注意力头中关注输入的不同方面。这可以帮助模型更好地理解输入的复杂性。模型可能会看到我喜欢吃并尝试预测出苹果。通过这种方式,模型学习了词汇,语

    25、法,以及一些语义和上下文关系。参数学习参数学习通过预测任务,模型学习了一组参数,这些参数可以捕捉到输入文本的模式,它们将在训练过程中不断调整,以更准确地预测下一个词。模型推理模型推理模型训练完成后,可以用它来生成新的文本或回答问题。假设我们向模型提出一个问题:我应该吃我应该吃什么水果?什么水果?,模型会考虑这个输入,根据它在训练过程中学到的知识来生成一个答案。模型可能会回答你可以试试苹果。你可以试试苹果。注意力机制注意力机制在推理过程中,模型会使用注意力机制技术来决定哪些输入词对生成答案最重要。例如,在上面的问题中,模型可能会认为吃和水果这两个词最重要,因为这两个词直接相关于应该选择哪种水果。

    26、自回归生成自回归生成GPT-4模型在生成文本时是自回归的,这意味着它一次生成一个词,然后将这个词添加到输入序列中,以生成下一个词。这一过程持续进行,直到生成一个结束符号,或达到了设定的最大。多头注意力多头注意力AIAI缺陷:臆造之辞缺陷:臆造之辞 概率幻概率幻觉觉 AI AI幻觉(幻觉(AI HallucinationsAI Hallucinations)是指生成式人工智能模型在生成文本或回答问题时,尽管表面上呈现出逻辑性和语法正确的形式,但其输出内容可能包含完全虚构、不准确或与事实不符的信息。AI幻觉的产生通常是由于模型在缺乏相关信息的情况下,通过概率性选择生成内容,而非基于真实世界的知识库

    27、或逻辑推理,这使得其输出不仅难以信赖,且可能误导用户。形成原因形成原因除AI幻觉这一关键缺陷外,潜在的缺点与局限还包括可解释性、计算成本、数据偏见、实时更新、数据安全、个人隐私、恶意输出等。幻觉类型数据可用性理解能力深度语境精确度外部信息整合能力逻辑推理和抽象能力典型错误表现数据误用有数据低高高中误用已有数据,回答部分不符或细节错误语境误解有数据高低高中对问题的意图理解错误,回答偏离主题信息缺失无数据中高低中未能正确获取或整合外部信息推理错误部分数据高高中低逻辑推理中存在漏洞或错误假设无中生有无数据低中低低在无数据支持下,生成完全虚构的信息AIAI幻觉:五类七特幻觉:五类七特 虚实迷域虚实迷域

    28、 五五“类类”七七“特特”OpenAI o1OpenAI o1:跨代进化:跨代进化 推理优先推理优先添 加 标 题添 加 标 题在金融领域的应用可以帮助分析复杂的市场数据,制定投资策略,优化风险管理,提高金融决策的准确性。在编程领域表现出色,能够生成高质量代码,优化算法,帮助开发者提高生产力。在教育领域帮助学生理解复杂的数学和科学概念,提供个性化的学习辅导,提升教育效果。在医学领域的应用提高诊断准确性,辅助医生制定个性化治疗方案,提升整体医疗服务质量。在科学领域推理能力显著提高,帮助研究人员进行更深入的理论分析和数据解释,从而加速科学发现。在内容创作和编辑方面表现优异,能够生成高质量的文本,帮

    29、助作家和编辑提高工作效率。在咨询领域能够帮助企业在市场趋势预测、战略规划、资源优化等方面做出更加科学和高效的决策。o1o1模型的社会影响模型的社会影响一一二二三三四四五五六六七七 o1o1模型的价值模型的价值AIAI推理的跨代进化推理的跨代进化暴力推理的工程突破暴力推理的工程突破多领域的推理应用多领域的推理应用“超智能超智能AgentsAgents”的崛起的崛起科学研究的辅助作用科学研究的辅助作用教育领域的深入探索教育领域的深入探索 人文社科研究能力排序人文社科研究能力排序博士生 4o 博士博士o1o1 (理工科理工科)助助理教授理教授 o1o1(人文社科)(人文社科)副教授 教授 人机共生人

    30、机共生(教授(教授+AI+AI)人类一流专家o1的认知推理能力,达到了理科博士理科博士和文科文科助理教授助理教授的水平模式融合与进化模式融合与进化ReAct+P&S:强化决策行Reflexion+Self-D:深度认知LLMC+LATS:高效并行决策.多模态交互理解跨场景推理决策场景应用与突破场景应用与突破智能制造提质增效医疗辅助决策支持金融风控体系建设提升预训练数据质量优化提示词策略增强工具调用能力改进反馈机制 语言大模型:群雄逐鹿语言大模型:群雄逐鹿 齐头并进齐头并进除OpenAI o1外,以下六大模型是全球大模型中综合表现最好的一批模型。公司公司模型模型核心功能核心功能应用场景应用场景优

    31、点优点缺点缺点OpenAIOpenAIGPT-4oGPT-4o对话生成、内容创作、代码编程客服、内容创作、教育辅导强大的理解能力和知识库可能产生错误信息,费用高AppleAppleApple IntelligenceApple Intelligence语言处理、图像识别、隐私保护智能助手、健康监测、智能家居本地计算快速,隐私保护好受设备限制,大型任务能力不足xAIxAIGrok 2Grok 2复杂推理和多模态理解搜索与文案系统、智能监控软件平台集成度高,质量稳定启动门槛高,部分场景不稳定MetaMetaLlama 3.2Llama 3.2模型微调和快速适配能力自然对话、行业解决方案迁移学习能力

    32、强,适应性好上下文连贯性有待提升GoogleGoogleGemini 1.5-ProGemini 1.5-Pro多模态数据处理,跨语言生成自动驾驶、智能对话、边缘计算跨模态理解能力强部分内容生成质量不稳定AnthropicAnthropicClaude 3.5-SonnetClaude 3.5-Sonnet文本理解、对话、写作、翻译聊天机器人、写作助手、客服跨领域应用广,安全可靠高负载下性能不稳,图片理解有限 RunwayRunway、可灵可灵和ViduVidu是在视频大模型中较有竞争力的三个大模型,综合表现较好。此外,OpenAI的Sora、抖音的PixelDance、Meta的Movie

    33、Gen也发出预告,但现在模型仍未对个人用户推出。视频大模型视频大模型:三足鼎立三足鼎立 潮头涌动潮头涌动公司公司产品产品/模型模型发布时间发布时间是否公开可用是否公开可用功能特色功能特色OpenAISora2024/2/16否支持生成最长达1分钟的视频抖音即梦2024/5/9全面开放支持画布扩展、局部重绘Luma AIDream Machine2024/6/13全面开放支持设置首尾帧、制作无限循环视频RunwayGen-3 Alpha2024/6/17全面开放支持文字嵌入,场景切换智谱清影2024/7/26全面开放且免费支持30秒生成高质量视频生数科技Vidu2024/7/30全面开放支持比例

    34、切换,首尾帧设置快手可灵1.52024/9/19全面开放支持根据人声对口型抖音豆包PixelDance/PixelWeed2024/9/24针对企业开放内测支持多动作多主体交互Pika LabsPika 1.52024/10/2全面开放支持爆炸、融化、粉碎或膨胀的Pika effects;支持局部修改和画面扩张MetaMovie Gen2024/10/4否支持为视频匹配节奏和音乐 在国内外一众音乐大模型中,Suno的表现最为优异,在音乐创作的全流程中表现出色。但Minimax、昆仑万维、腾讯、抖音、网易也在开发新功能并完善原有功能。音乐大音乐大模型模型:众星捧月众星捧月 “一超多强一超多强”所

    35、属公司所属公司模型名称模型名称主要特点主要特点亮点功能亮点功能适用场景适用场景SunoSuno AI AISunoSuno-能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全流程-多语言交叉混合生成能力-支持多种音乐风格和情绪状态-支持所有用户制作4分钟的歌曲,创建最长2分钟的歌曲扩展个人音乐创作、社交媒体内容创作、音乐教育等MiniMaxAbab-music-1-端到端音乐生成能力-纯音乐、清唱作品、伴奏、人声生成-拟人化生成能力-支持多种音乐风格和情绪状态音乐创作和制作、影视配乐、内容创作等昆仑万维天工SkyMusic-端到端音乐生成能力-人声自然度高、发音可懂度强-方言演唱能力-支持人声

    36、、歌词使用多种方言文化传播、社交媒体内容创作、音乐教育等腾讯琴乐大模型-能根据文本或音频输入生成音乐-遵循乐理生成能力-支持自动编辑和乐谱生成-支持音频文本对齐-支持乐谱/音频表征提取音乐教育、社交媒体内容创作等抖音豆包-零样本人声克隆能力-旋律歌词局部改写能力-预设多种情绪状态-支持一键分享至社交平台-支持多种情绪状态-支持旋律仿写个人音乐创作、社交媒体内容创作、音乐教育等网易网易天音-一站式AI音乐创作平台-功能免费使用-支持用户自主调整乐器、编曲-支持音轨上传和段落结构设置专业音乐创作、音乐教育、音乐娱乐等国外产品:国外产品:爆款迭出爆款迭出 生态生态繁荣繁荣除上榜应用外,近期又发布了C

    37、ursor、Notebook LM等极具潜力的AIGC网页端应用,进一步丰富AI产品生态上榜应用类型上榜应用类型占比占比AI 图像生成&编辑18%AI聊天机器人18%AI视频生成&编辑12%AI角色生成8%AI音乐&音频生成8%国内产品:新品云集国内产品:新品云集 百舸争流百舸争流类型类型AIAI工具名称工具名称聊天聊天/内容生成内容生成文心一言通义千问Kimi(月之暗面)腾讯混元讯飞星火抖音豆包智谱AI百川智能360智脑字节小悟空达观数据曹植AIAI办公办公-综合综合360数字员工有道AIAIAI办公办公-OfficeOfficeAiPPTiSlideWPS AIChatPPT360苏打办公

    38、酷表ChatExcel商汤办公小浣熊AIAI办公办公-会议纪要会议纪要讯飞听见阿里通义听悟飞书妙记腾讯会议AIAIAI办公办公-脑图脑图ProcessOn亿图脑图GitMind思乎boardmix 博思白板妙办画板AIAI提示词提示词提示工程指南词魂类型类型AIAI工具名称工具名称AIAI办公办公-文档文档司马阅AI文档360AI浏览器AIAI写作写作有道云笔记AI腾讯 Effidit讯飞写作深言达意阿里悉语字节火山写作秘塔写作猫光速写作WriteWise笔灵AI易撰Giiso写作机器人5118 SEO优化精灵AIAI翻译翻译沉浸式翻译彩云小译网易见外AIAI搜索引擎搜索引擎天工AI搜索(昆仑

    39、万维)360AI搜索秘塔AI搜索perplexity.aisciphi.aidevv.ai图像生成图像生成/编辑编辑通义万相类型类型AIAI工具名称工具名称AIAI音频音频中科声智魔音工坊网易天音TME Studio讯飞智作AIAI视频视频PixVerse绘影字幕万彩微影芦笋AI提词器360快剪辑万彩AI数字人数字人清博元娲硅基生命腾讯智影聚力维度一帧秒创万兴播爆AIAI写代码写代码昇思MindSpore百度飞桨PaddlePaddle AI Code assistantZelinAIaiXcoder商汤代码小浣熊CodeArts Snap天工智码模型训练模型训练/部署部署火山方舟魔搭社区文心

    40、大模型类型类型AIAI工具名称工具名称图像生成图像生成/编辑编辑文心一格剪映AI腾讯ARC360智绘无限画美图设计室liblib.aiTusi.Art标小智Logo生成佐糖Vega AI美图WHEE无界AIBgSub阿里PicCopilot搜狐简单AI6penAIAI设计设计天工大模型元裳AI阿里堆友稿定AI墨刀AI莫高设计MasterGo AI创客贴AI即时AIPixsO AI抖音即创腾讯 AIDesign美间国内产品:百模大战国内产品:百模大战 格局格局初现初现 百度百度 文心一言文心一言 华为华为盘古盘古 Minimax MinimaxAbab-music-1Abab-music-1 科

    41、大讯飞科大讯飞星火认知星火认知 阿里巴巴阿里巴巴通义千问通义千问 腾讯腾讯混元混元/元宝元宝 360360360360智脑智脑 抖音抖音 豆包豆包 月之暗面月之暗面KIMIKIMI DeepSeek DeepSeek 智谱智谱AIAI 昆仑万维昆仑万维SkyworkSkywork 百川智能百川智能百川百川ChatGLMChatGLM 快手快手 可灵可灵 生数生数科技科技ViduVidu深度深度求索求索国产之路:特色效应国产之路:特色效应 着眼着眼“五五合合”与领先新兴产业结合与领先新兴产业结合与传统优势产业结合与传统优势产业结合与短视频结合与短视频结合与直播带货结合与直播带货结合打造智能车联网

    42、系统,实现车辆间的信息互联开发车载AI助手,提升乘车体验优化新能源电池管理系统,延长使用寿命分析产业链数据,优化供应链管理预测市场需求变化,指导产品研发方向实现生产流程的智能化和自动化智能客服系统,提高用户咨询效率实时语音翻译,拓展跨境直播市场虚拟主播技术,降低人力成本智能内容创作,生成高质量视频脚本和创意视频内容审核,提高效率和准确度智能视频编辑,简化后期制作流程国产大模型的中国道路国产大模型的中国道路我国在新三样(电动汽车、新三样(电动汽车、锂电池和太阳能光伏)、锂电池和太阳能光伏)、集聚特色优势产业、短视集聚特色优势产业、短视频、直播带货和频、直播带货和ITIT类文化部类文化部分分领域创

    43、作领域创作上都做到了世界第一,国产大语言模型需发挥这些领域世界第一的中国优势,发挥长边效应,着眼“五样”,同优势产业共进发展。与文化创作结合与文化创作结合与网文产业结合,促进降本增效与玩具产业结合,推进智能设计与游戏产业结合,智创美术资源三三生成式生成式文、图、乐、剧文、图、乐、剧图灵测试:潜力尽显图灵测试:潜力尽显 智能超越智能超越OpenAI-o1OpenAI-o1在文本领域,在文本领域,MMidjourneyidjourney6 6.1.1在图像领域,在图像领域,Suno3Suno3.5.5在音乐领域,在音乐领域,Vidu/Vidu/可灵可灵/Runway/Runway在视频领在视频领域

    44、,域,FSD12.5FSD12.5在自动驾驶领域相继事实通过图灵测试,推动了人类社会革新。在自动驾驶领域相继事实通过图灵测试,推动了人类社会革新。在传统艺术中,苏东坡的在传统艺术中,苏东坡的“心目手俱得之矣心目手俱得之矣”强强调了创作过程中心灵(心)、观察(目)、和技调了创作过程中心灵(心)、观察(目)、和技艺(手)的紧密结合。艺(手)的紧密结合。这种观点体现了艺术创作是一种全面的人类活动。心目言三统一:智绘千里心目言三统一:智绘千里 观机明理观机明理AIAI艺术是艺术是“心目言心目言”三统一三统一,意味着艺术的自我观察和理解,体现了AI在艺术创作中的主动性和创造性;同时代表手的部分功能退化,

    45、为人类艺术创作提供了新的方法。“心目言心目言”三统一的逻辑:三统一的逻辑:体现在AI如何将其内在的设计哲学(心)、对数据的理解和感知(目)以及设计者的艺术理念和审美偏好(言)融合为一体,创造出独特的艺术作品。零知识启动的普遍性:借助AI提供的信息检索、学习推荐和初步创意生成功能,任何人都可以从“零知识”的起点开始,轻松启动创造过程。零知识启动零知识启动高知识生产的效率与规模:AI高效的知识生产方式不仅提高了生产速度,还确保了知识的准确性和可靠性,为新知识的创造奠定了坚实基础。高知识生产高知识生产新知识创造的激发与涌现:人类与AI的协同工作激发了新的创意灵感和思维火花,通过跨界融合、技术革新和模

    46、式创新等方式,不断推动知识边界的拓展和深化。新知识创造新知识创造元知识的提炼与引领:人类可以借此更有效地指导AI的创造活动;元知识也成为连接不同领域和学科的桥梁,促进了知识的交叉融合和协同创新。元知识形成元知识形成创造力跃迁:零知启动创造力跃迁:零知启动 高识生产高识生产创造力跃迁在创造力跃迁在AIAI时代体现为从时代体现为从“零知识启动零知识启动”到到“高知识生产高知识生产”,再到,再到“新知识创造新知识创造”,最终到,最终到“元知识形成元知识形成”的完整过程。的完整过程。等级等级特点特点难度难度概率概率美感美感凡品凡品使用简单的提示词低约90%(随手可得)较好,满足较高视觉需求,适用日常使

    47、用和快速创作精品精品需稍复杂的提示词,包括指定的风格、细节和色彩搭配中等约9%(十里挑一)显著提升,更协调细致,适合高质量图像需求优品优品提示词较为复杂,涉及构图、光影等艺术细节较高约0.9%(百里挑一)具备高级艺术感和创意表现,适合专业水准需求罕品罕品提示词要求更加复杂细致高约0.09%(千里挑一)独特且罕见,高艺术价值,适合追求个性化用户孤品孤品提示词极其复杂,且需要结合深刻的艺术思维极高约0.01%(万里挑一)超凡,独特艺术气质,强烈视觉冲击力,AI艺术生成巅峰之作AIAI艺术评价:概率进阶艺术评价:概率进阶 匠心独运匠心独运三重概率:三重概率:多层互动多层互动 逐层精炼逐层精炼AIGC

    48、的三层概率交互的内容生成体系,描述了人工智能与人类在内容创作中的协同合作。通过初始生成初始生成、交互筛选交互筛选和主观优化主观优化三个层次,构建了一个动态循环的创作流程,以提升内容生成的效率和质量,满足市场的多样化需求。初始生成概率初始生成概率AI通过大模型的概率预测与推理生成初步内容。交互筛选概率交互筛选概率用户与AI互动,通过对话和选择筛选出更优作品。主观优化概率主观优化概率用户基于自身能力和创意对生成内容进行个性化优化。初始生成初始生成概率概率交互交互筛选概率筛选概率主观主观优化概率优化概率三型创作:复合三型创作:复合智能智能 共创平衡共创平衡强调逻辑和可控性,相同输入得一致结果得一致结

    49、果,确保作品符合预期。应用于设计、工程等领域,具有稳定、精确和高效的优点。通过明确的框架和规则,保证结构严谨,满足商业需求和品牌一致性。确定确定型创作型创作强调灵感和不可预测性,相同输入得得不同结果不同结果,体现随机性。常用于抽象艺术、实验音乐等,激发灵感,打破传统束缚。通过随机算法或互动反馈,创造意外美感,适合个性表达和作品唯一性。非确定非确定型创作型创作结合确定性和非确定性,兼具规则与随机。利用确定性框架,引入非确定性元素,作品核心一致且多样核心一致且多样。应用于交互媒体、生成艺术等。创作者与AI互动,促进创意进化,平衡秩序与创新,拓展艺术边界。融合融合型型创作创作随着AI发展,融合创作将

    50、主导未来,人机协同实现创新与可控统一。AI不仅提供灵感,还能实现大规模内容生成。规则与随机并存的模式将成主流,通过互动优化作品。教育、创意产业等领域将受其影响,推动创作走向自适应生态,开启新一轮创作革命。深度分析与未来趋势深度分析与未来趋势三元分离:算法创作三元分离:算法创作 情感隔情感隔离离创作过程的分离创作过程的分离AI创作基于数据和算法计算,人类创作源于情感体验、文化背景和创造性思维,体现机械性与情感驱动的区别。AI创作:通过数据输入和算法训练生成内容。人类创作:由情感驱动和思维过程产生创意与表达。三元三元分离分离情感表达的分离情感表达的分离AI可模拟情感但非发自内心,人类的情感表达是真

    51、实的情感反映,形成模拟与真实的区别。AI的情感模拟:学习并模仿大量情感化内容,生成看似有情感的作品。人类的情感表达:通过生活经历、文化背景和情感体验表达情感。受众感知的分离受众感知的分离受众关注作品传递的情感和信息,不一定在意创作者是否真正拥有情感,体现情感效果与情感投入的区别。作品的情感效果:受众感知到的情感和价值,基于作品传达的信息。创作者的情感投入:无论是AI还是人类的作品,均可使观者感知到其中的情感投入。三元分离模型揭示了AI与人类创作在创作过程、情感表达和受众感知上的区别。尽管AI无情感,受众仍能接受其作品的情感效果。这挑战了传统对艺术情感的认知,提出了“艺术创作中情感是否为必要元素

    52、”的思考,也是“AI使用学”在人机共生领域的重要探讨方向。3.13.1生成文字生成文字机忆之地获科幻大赛二等奖机忆之地获科幻大赛二等奖 下载链接:https:/ 提取码:524z 天命使徒人机融合式文学天命使徒人机融合式文学华东师范大学传播学院院长王峰教授及其团队通过“大语言模型提示词工程人工后期润色”的方式完成国内首篇百万字国内首篇百万字AIAI小说小说AIAI论文写作论文写作 :批判性捧红的多学科分析:批判性捧红的多学科分析 下载地址:下载地址:清新研究清新研究 经过共十五次AI交互(13次文本对话、1次图片对话、1次AI幻觉矫正),经历约三十分钟撰写、十分钟word排版删减,清华大学新闻

    53、与传播学院沈阳教授团队使用AI生成了一篇8264字的小论文。本论文100%由AI撰写,文章分为理论分析、自反性论证、文献综述、历史案例分析、近期案例、形式化、多学科视角分析和展望与不足八部分。其中,形式化在一定程度上弥补了以往人文社科学者在数理形式分析上的不足。下载链接:https:/ 下载地址:下载地址:清新研究清新研究 经过共十五次AI交互(13次文本对话、1次图片对话、1次AI幻觉矫正),经历约三十分钟撰写、十分钟word排版删减,清华大学新闻与传播学院沈阳教授团队使用AI生成了一篇8264字的小论文。本论文100%由AI撰写,文章分为理论分析、自反性论证、文献综述、历史案例分析、近期案

    54、例、形式化、多学科视角分析和展望与不足八部分。其中,形式化在一定程度上弥补了以往人文社科学者在数理形式分析上的不足。下载链接:https:/ 情意共生情意共生影月行舟影月行舟孤帆隐影逐烟霞,晚渚寒钟映暮沙。孤帆隐影逐烟霞,晚渚寒钟映暮沙。松下泉声通远壑,楼中月色照横斜。松下泉声通远壑,楼中月色照横斜。山深静客停云梦,水净归鸿带月华。山深静客停云梦,水净归鸿带月华。光天入水随星舟,山夜连江映影灯。光天入水随星舟,山夜连江映影灯。余欲渔鱼于雨余。雨愈裕,余郁。遇渔愚,于语予渔愚谕:“予余鱼,余予玉。”渔愚语余:“欲予鱼,予余玉。”余予玉予渔,渔愚予鱼予余。余与渔愚愈语愈谕,愈语愈寓。余欲渔鱼谕余欲

    55、渔鱼谕文生评论文生评论文生文生预测预测文生小说文生小说天不足于西北,其下高以强;地不足于东南,其上。不足于上者,有余于下,不足于下者,有余于上。天道贵弱,削成者以益生者;伐于强,责于坚,以辅柔弱。郭店楚墓竹简:智能复原郭店楚墓竹简:智能复原 文化重现文化重现生成格言:智能凝思生成格言:智能凝思 意境自现意境自现困从易生困从易生光自幽起光自幽起AIGCAIGC与文言文:惊艳文采与文言文:惊艳文采 情感注能情感注能 A I G C 文 言 文 生 成特 有 优 势 v s 发 展 阻 力父亲节赋父亲节赋和太史刘和太史刘天下有情者,心有高山,而至高者,乃父爱也。壁垒重重,众人可退;为父之人,焉能退?

    56、天下有情者,心有高山,而至高者,乃父爱也。壁垒重重,众人可退;为父之人,焉能退?明灯独守,四顾昏暗,父之灯火,燃千秋光,照子归路。明灯独守,四顾昏暗,父之灯火,燃千秋光,照子归路。为子则柔,柔而不弱;为父必威,威而不苛。若无此威,则无问可答;若无此柔,则无爱可为子则柔,柔而不弱;为父必威,威而不苛。若无此威,则无问可答;若无此柔,则无爱可承。父虽平凡,护子若龙;父目如炬,虎视群狼。不使子女为羸弱之粮,父心无私,披荆斩承。父虽平凡,护子若龙;父目如炬,虎视群狼。不使子女为羸弱之粮,父心无私,披荆斩棘。劳苦化福,恩若天地,庇护万难。棘。劳苦化福,恩若天地,庇护万难。肩无论宽窄,必挡万里狂风;眼无论

    57、远近,必照一家光明。向天求变,需忍岁久,父如巍山,肩无论宽窄,必挡万里狂风;眼无论远近,必照一家光明。向天求变,需忍岁久,父如巍山,任风霜蚀,静候星归。一片丹心映晚霞,几度春秋度白发。飞舟越海,父心辽远;丹月映江,任风霜蚀,静候星归。一片丹心映晚霞,几度春秋度白发。飞舟越海,父心辽远;丹月映江,父爱深长。人间四月芳菲尽,父心忧愁未曾止。期子凌云,故推舟离岸;背影依依,但愿子父爱深长。人间四月芳菲尽,父心忧愁未曾止。期子凌云,故推舟离岸;背影依依,但愿子早归。早归。父者,忍苦修行而无解脱,历万劫而不为仙。披星戴月无怨悔,罕见清闲而珍视。风摇楼阁,父者,忍苦修行而无解脱,历万劫而不为仙。披星戴月无

    58、怨悔,罕见清闲而珍视。风摇楼阁,水泛舟船,父爱如山,永世不移。纵使功名满天下,不及父颜展笑颜。水泛舟船,父爱如山,永世不移。纵使功名满天下,不及父颜展笑颜。1.1.设定明确的目标与上下文设定明确的目标与上下文 说明任务的具体目标(如获取信息、生成文本、分析数据等)提供背景信息,以减少模型的猜测 针对不同的场景,给出期望的输出类型(如表格、列表、总结等)2.2.激活角色与思维模式激活角色与思维模式 设定模型为某种特定的身份,如技术专家、教师或HR 指导模型使用某种特定的写作风格(如正式、非正式、技术性等)让模型模拟某种特定的思维模式,如批判性思维、创造性思维等3.3.逐步拆解复杂任务逐步拆解复杂

    59、任务 将复杂问题分解为多个独立的步骤 在每一步操作结束后,请求模型总结或验证中间结果 合并多个子任务的输出,形成完整的解决方案或总结4.4.引导深入推理与思考引导深入推理与思考 让模型分步骤推导出答案,要求“思维链”推理 要求模型在作答前进行简要的自我反思或验证 要求模型解释每一步的思路,而不仅仅是给出最终答案5.5.提供参考材料与外部资源提供参考材料与外部资源 向模型提供外部参考文献或文本,并要求根据这些材料生成答案 要求模型在作答时引用或链接到具体的来源 集成外部工具(如代码执行)来完成复杂的计算或查找任务6.6.动态反馈与迭代优化动态反馈与迭代优化 在收到回答后,指出模型的误差或不足,并

    60、要求修正 让模型根据前一轮的输出进行自我改进 请求模型总结多轮对话中的关键点,确保连贯性和准确性提示词工程:精准指引提示词工程:精准指引 效能增益效能增益 1.1.TASTETASTE框架框架 Task Task(任务):定义模型主要任务或生成内容。AudienceAudience(目标受众):明确说明目标受众。Structure Structure(结构):为输出的内容提供明确的组织结构,包括段落安排、论点展开顺序或其他逻辑关系。Tone Tone(语气):指定模型回答时的语气或风格。ExampleExample(示例):例子或模板可帮助模型理解输出风格或格式。2.2.ALIGNALIGN框

    61、架框架 AimAim(目标):明确任务的最终目标。LevelLevel(难度级别):定义输出的难度级别。InputInput(输入):指定需要处理的输入数据或信息,或要求模型依据某些事实或条件进行推理。GuidelinesGuidelines(指导原则):提供模型在执行任务时应该遵循的规则或约束。Novelty Novelty(新颖性):明确是否需要模型提供原创性、创新性的内容,是否允许引用已有知识。提示词框架:逻辑锚定提示词框架:逻辑锚定 思维引导思维引导示例示例 AimAim:创建一篇关于“可持续发展”的文章,解释其核心理念。LevelLevel:适合高中生阅读,不需要专业术语。Input

    62、Input:提供目前的环境问题的背景,讨论应对全球变暖的策略。GuidelinesGuidelines:文章应使用简洁明了的语言,并避免复杂的技术概念。NoveltyNovelty:要求结合最新的环境数据,提出新颖的观点和解决方案。示例示例 TaskTask:写一篇关于数据隐私的重要性的简短博客文章。AudienceAudience:普通的互联网用户,非技术背景。StructureStructure:文章需要有明确的开头、中间讨论和结尾,开头提出问题,中间介绍原因和影响,结尾提供建议。ToneTone:采用友好、易懂的语气。ExampleExample:类似于纽约时报科技专栏的风格。3.23.

    63、2生成图像生成图像绘画本质:心灵之镜绘画本质:心灵之镜 艺海无涯艺海无涯绘画的本质便是将艺术家脑中的构思投射至现实世界。AI的出现使得普罗大众在未经过专业的前提下即可将心中所想加以表达。表达表达与沟通与沟通通过色彩、线条、形状、构图等视觉元素,将自己的思想、情感、观念乃至对世界的理解转化为可视化的形式,与观众进行跨越语言和文化的沟通0101审美体验审美体验引导人们以独特的视角观察世界,感受美、欣赏美。作品所展现的和谐、对比、平衡等美学原则能丰富审美感知,提升审美素养0202文化传承与创新文化传承与创新记录不同历史时期、不同地域的文化特色和艺术风格,成为连接过去与未来的桥梁;是文化创新的重要源泉

    64、0303社会反映与批判社会反映与批判通过作品表达对社会现象的关注和批判,激发公众的社会责任感和参与意识,推动社会的进步和发展0404情感与精神的寄托情感与精神的寄托为人们提供了一个静谧的避风港,让人们得以暂时忘却烦恼,沉浸在艺术的海洋中,寻找心灵的慰藉和精神的寄托0505书崖天境书崖天境国外首次国外首次AIAI转绘展转绘展3 3月月1313号号 全球第一次全球第一次AIAI转绘展转绘展 伦敦书展伦敦书展AI转绘,指使用AI基于文本提示或其他形式的输入重新创作或模仿现有的视觉艺术作品的过程。伦伦敦敦书书展展演演示示AIAI视视频频国内首次国内首次AI转绘展转绘展4月月16日日 中国第一次中国第一

    65、次AI转绘展转绘展 一个人的北京城一个人的北京城本次展览以一个人的北京城中章可先生所绘原图为基础,利用AI进行转绘再创。人机共生人机共生AI绘画展,清华科博至绘画展,清华科博至2025.5创作思路创作思路:理论筑基理论筑基 词工雕琢词工雕琢创意萌芽:灵感捕获与融合创意萌芽:灵感捕获与融合跨界融合:鼓励跨领域思考与多元素融合,激发创意火花。情感共鸣:深入挖掘个人或社会的情感需求,寻找能够触动人心的创意主题。技术前瞻:利用新技术为艺术创作带来新的可能性。词工雕琢:精准构建提示词与指令词工雕琢:精准构建提示词与指令词汇精选:精心挑选词汇,作为AI创作的提示词。逻辑构建:通过合理的逻辑结构和叙事线索串

    66、联提示词,形成具有连贯性和故事性的创作指令。迭代优化:不断测试和调整提示词与指令,追求最佳效果。RPARPA自动化:流程优化与效率提升自动化:流程优化与效率提升流程标准化:将重复性任务标准化,为RPA自动化奠定基础。智能辅助:减轻艺术家的工作负担,使其更专注于创作本身。持续监控:对RPA执行过程进行监控和评估,确保流程的高效性和准确性。理论筑基:艺术理论与理论筑基:艺术理论与AIAI逻辑的融合逻辑的融合艺术原理:学习艺术创作的基本原理和美学理论,确保AI生成的作品符合艺术规律。算法理解:研究并理解AI算法的工作原理。理论创新:探索新的创作理论和方法。精品精品诞生:诞生:AIAI创作与人工干预的

    67、协同创作与人工干预的协同AI初稿:利用AI技术根据提示词与指令生成初步的艺术作品。人工润色:通过人工干预进行必要的修改和润色,提升作品的艺术价值。风格融合:融入艺术家的个人风格,使作品更具辨识度和深度。智评反馈智评反馈:五品评估法五品评估法将作品划分为五个的等级:凡品、精品、优品、罕品和孤品。代表作品在创意、难度、艺术性和美感等方面的不同水平。循环迭代:将AI评估与创作过程相结合,形成循环迭代的创作模式。美学理论:启迪创意美学理论:启迪创意 引领风尚引领风尚不可能美学不可能美学 趋无限美学趋无限美学反物理美学反物理美学异世界美学异世界美学高细节美学高细节美学 乱混沌美学乱混沌美学 融元素美学融

    68、元素美学 寂幻流美学寂幻流美学多视差美学多视差美学 奇智幻美学奇智幻美学错元素美学错元素美学多尺度美学多尺度美学 错时空美学错时空美学 无厘头美学无厘头美学 迷融汇美学迷融汇美学 大撕裂大撕裂美学美学超风格美学超风格美学 涉及到时间和运动的元素,创造出涉及到时间和运动的元素,创造出看似动态进行但永远无法完成的行看似动态进行但永远无法完成的行为或过程。为或过程。动态不可能性美学动态不可能性美学视觉错觉美学视觉错觉美学通过视觉错觉创造出在逻辑上看似通过视觉错觉创造出在逻辑上看似不可能的图像。不可能的图像。利用几何图形和结构的悖论,如利用几何图形和结构的悖论,如“潘洛潘洛斯阶梯斯阶梯”或或“艾舍尔立

    69、方体艾舍尔立方体”,探讨空,探讨空间和结构的不可能性。间和结构的不可能性。几何悖论美学几何悖论美学创造一种或多种认知上的冲突,迫使创造一种或多种认知上的冲突,迫使观众在不同的解释之间做出选择。观众在不同的解释之间做出选择。认知冲突美学认知冲突美学数字和虚拟不可能美学数字和虚拟不可能美学将不可能美学的元素用作探讨更深层将不可能美学的元素用作探讨更深层次哲学问题和象征意义的工具。次哲学问题和象征意义的工具。哲学和象征性不可能美学哲学和象征性不可能美学利用计算机图形、利用计算机图形、VRVR和和ARAR技术,创技术,创造出在物理世界中无法实现的不可能造出在物理世界中无法实现的不可能结构和体验。结构和

    70、体验。不可能美学:突破常规不可能美学:突破常规 想象无垠想象无垠趋无限美学:洞察秋毫趋无限美学:洞察秋毫 遐思遨游遐思遨游通过艺术的手段将一件事物不断变形和重塑,挑战和扩展人类想象的边界,探讨艺术和文化如何表达通过艺术的手段将一件事物不断变形和重塑,挑战和扩展人类想象的边界,探讨艺术和文化如何表达对无限可能性的追求和想象;聚焦于技术和科学的未来发展,涉猎宇宙、自然界和意识等更为广泛的对无限可能性的追求和想象;聚焦于技术和科学的未来发展,涉猎宇宙、自然界和意识等更为广泛的领域领域反物理美学:超凡脱俗反物理美学:超凡脱俗 异想天开异想天开规规 则则违反自然法则违反自然法则超现实组合超现实组合想象力

    71、的驱动想象力的驱动观感优先观感优先通过创造违反物理定律的元素、场景和故事,引发观众对现实、可能性和知觉的深层次思考;包含通过创造违反物理定律的元素、场景和故事,引发观众对现实、可能性和知觉的深层次思考;包含了对重力、空间、时间和逻辑的明显违背,以此来创造一种超脱于现实世界的感觉和体验。了对重力、空间、时间和逻辑的明显违背,以此来创造一种超脱于现实世界的感觉和体验。异世界美学:开天辟地异世界美学:开天辟地 梦幻异影梦幻异影创造与我们所知世界不同的宇宙,其拥有自己独特的规创造与我们所知世界不同的宇宙,其拥有自己独特的规则、历史、生物、社会结构和物理定律则、历史、生物、社会结构和物理定律。逻辑:逻辑

    72、:是构建一个内部逻辑一致、自成体系的世界。尽管这个世界的规则可能与现实截然不同,但它们在该世界内部是合理的、连贯的。超越与逃避超越与逃避逃避现实的手段,对现实世界可能性的一种拓展和反思。多样性与可能性多样性与可能性通过想象不同于人类的外星生命形态,扩展对宇宙中生命可能形态的认知边界。内在逻辑与美学价值内在逻辑与美学价值具有其内在的逻辑和美学价值。文化共鸣与心理影响文化共鸣与心理影响包括探索未知的渴望、对美的追求、以及对生命意义和宇宙位置的思考。接受度的社会文化因素接受度的社会文化因素受到其文化背景、教育水平、科技发展程度以及社会价值观的影响。理理解解人人类类想想象象外外星星生生命命形形态态的的

    73、关关键键点点1 1高细节美学:细腻入微高细节美学:细腻入微 层次分明层次分明2 2视觉密度与清晰视觉密度与清晰度的平衡度的平衡细节与主题的动细节与主题的动态调整与迭代态调整与迭代核心在于使用核心在于使用AIAI工具生成包含大量细节的图像,这些细节在数量上远超一般工具生成包含大量细节的图像,这些细节在数量上远超一般AIAI生成的图像(通常为生成的图像(通常为2020到到4040个细节)达到个细节)达到150150个或更多,共同构成复杂、细腻且具有深度的视觉作品。个或更多,共同构成复杂、细腻且具有深度的视觉作品。提示词的精确度提示词的精确度与创造性与创造性细节的层次化细节的层次化超风格美学:跨界艺

    74、术,创造独特超风格美学:跨界艺术,创造独特绘画风格详情:https:/ ,包含跨文包含跨文化、跨媒介和跨化、跨媒介和跨技术的融合技术的融合。创新性创新性通过不同风格和通过不同风格和技术的融合创造技术的融合创造出新的艺术形式出新的艺术形式和表达方式。和表达方式。融合融合性性不同艺术风格的不同艺术风格的元素被综合在一元素被综合在一起,形成多元化起,形成多元化的艺术语言。的艺术语言。互动性互动性超风格美学的艺超风格美学的艺术作品往往强调术作品往往强调观众的参与和互观众的参与和互动。动。平衡平衡性性支持全球化的艺支持全球化的艺术视角,同时也术视角,同时也重视对本土文化重视对本土文化和传统的尊重与和传统

    75、的尊重与融合。融合。演变演变性性随着新的艺术风随着新的艺术风格、技术和媒介格、技术和媒介的出现,其表现的出现,其表现形式和内涵也在形式和内涵也在不断发展。不断发展。超风格美学特征 艺术家或设计师在多种风格、时代、文化中自由穿梭,综合吸收,创造出独特的、跨界的艺术作品艺术家或设计师在多种风格、时代、文化中自由穿梭,综合吸收,创造出独特的、跨界的艺术作品;创造性地整合多种艺术元素,以开创性的方式表达艺术家的视觉和思想。创造性地整合多种艺术元素,以开创性的方式表达艺术家的视觉和思想。多尺度美学:微观察微多尺度美学:微观察微 层出不穷层出不穷艺术创作艺术创作产品设计产品设计游戏设计游戏设计绘画、雕塑、

    76、摄影等艺术形式可以利用多尺度美学,创造独特的艺术作品。产品设计可以利用多尺度美学,打造新颖、有趣的产品。游戏设计可以利用多尺度美学,创造奇幻的游戏世界。对比对比 陌生化陌生化 想象力想象力 多尺度美学原理多尺度美学原理情绪价值情绪价值 惊奇惊奇 敬畏敬畏 怜悯怜悯 喜悦喜悦 多尺度美学多尺度美学是一种审美体验,指在不同尺度下事物呈现出不同的美学特征,并由此引发人们独特的审美感受。错时空美学错时空美学:穿梭维度穿梭维度 交织虚实交织虚实 观众参与和体验观众参与和体验:观众需要在视觉上重新组织和解析画面,这一过程增强了参与感和艺术体验的个人性。新的叙述方式新的叙述方式:利用AI创建出不遵循传统叙述

    77、结构的作品,非线性地表达时间,或在视觉叙事中探索多个平行的故事线。感知和记忆的探索感知和记忆的探索:赋能艺术家探索人类感知和记忆如何处理时间与空间上的不连续性,从而启发心理学和认知科学的新研究。通过创造一种混乱的、非线性的感知世界,挑战我们的视觉和记忆常规。通过创造一种混乱的、非线性的感知世界,挑战我们的视觉和记忆常规。利用利用AIAI技术的能力,打破传统的时间和空间约束,通过艺术手段展现元素在多个非同步时空状态下的技术的能力,打破传统的时间和空间约束,通过艺术手段展现元素在多个非同步时空状态下的存在,从而创造出独特的视觉和感知体验。存在,从而创造出独特的视觉和感知体验。无厘头美学:荒诞乱序无

    78、厘头美学:荒诞乱序 智造奇趣智造奇趣 超现实主义的影响超现实主义的影响借鉴了超现实主义的某些元素,在创造梦境般的场景和组合不合逻辑的物体上表现得尤为明显。01010202 幽默和荒诞幽默和荒诞通过夸张或不寻常的视觉效果引发笑声或思考。能够以一种轻松愉快的方式挑战观众的预期,将平凡的事物转化为不同寻常的体验。批判和反思批判和反思透过其荒诞幽默的外壳,深刻地映射出对社会、文化和技术进步的批判性思考,展现艺术在探讨重大议题上的独特能力和价值。03030404 随机性与创造性随机性与创造性强调随机性与算法创造性的结合,不仅展示了人工智能技术的先进性,还体现了人类与机器在创造过程中的相互影响和潜在协作。

    79、利用人工智能技术创造的艺术或媒介,通过组合看似不合逻辑或毫无关联的内容,呈现一种混乱却独特的美学体验;不受常规逻辑和传统美学标准的限制,反映出一种超现实、荒诞或幽默的感觉。迷融汇美学:色形交映迷融汇美学:色形交映 视像错觉视像错觉 视觉错觉与现实融合视觉错觉与现实融合利用视觉错觉技术模糊现实与幻象的界限,激发对现实本质和表象真实性的反思。0101个体与环境的互融性个体与环境的互融性强调个体与环境的不可分割性,通过元素的交织象征个体在环境中的独立性和相互影响。0202自然与艺术的对话自然与艺术的对话将自然元素与抽象艺术背景结合,倡导自然与人类艺术创作之间的和谐美。0303迷失与探索的象征迷失与探

    80、索的象征通过复杂的视觉元素,引导观众反思身份认同和人生目标。0404颜色与形状的交融颜色与形状的交融将不相关的元素联系在一起,增强视觉冲击力,赋予作品深层次的哲学意义。0505 通过将颜色、形状和纹理相似但本质上不相关的元素结合,探讨个体与环境、自然与艺术、表象与本质之间的复杂关系,创造具有深层意义和视觉冲击力的艺术作品,激发观众对存在、认知和环境关系的深刻反思。大撕裂大撕裂美学美学:撕解现实:撕解现实 激荡心弦激荡心弦撕裂感的视觉冲击撕裂感的视觉冲击撕裂感作为视觉艺术的主要元素,通过明显的、具象化的撕裂效果,揭示社会问题的表象和矛盾。撕裂的象征意义撕裂的象征意义撕裂的画面传达出内在的冲突、不

    81、和谐和破碎感,揭示社会矛盾的深层次根源。色彩与简约的对比色彩与简约的对比色彩的运用不仅是视觉效果的增强,更是情感和意义的象征,简约的构图则确保观众能专注于核心问题和思想。不仅关注社会共鸣,更强调艺术的创新性和前瞻性。社会共鸣与艺术创新社会共鸣与艺术创新旨在通过视觉艺术中的撕裂感表达社会问题,激发观众的共鸣与思考;强调撕裂感的视觉冲击力和情感深度,揭示社会矛盾和冲突的本质。乱混沌美学:随机交织乱混沌美学:随机交织 无序生姿无序生姿研究复杂系统中的自组织现象,并将其引入艺术创作中,通过这些现象表现随机与有序的对立统一。创建具有自组织特性的艺术作品,探索自然与人工随机性的边界。通过模拟混沌系统中的吸

    82、引子轨迹,生成具有复杂结构和动态特性的艺术图案。运用非线性动力学中的分岔现象,创作多种可能性共存的艺术作品,展现艺术创作中的多样性和偶然性。通过量子计算和量子随机数生成器,创作基于量子不确定性的艺术作品,探索微观世界与宏观艺术表现之间的联系。随机性与关联性的共存,探索艺术创作中的非局域性。强调艺术创作过程中的即时性和观众参与性,通过互动生成随机和混沌的艺术形式。随机生成与自组织现象随机生成与自组织现象 即时性与参与性艺术即时性与参与性艺术01010202混沌理论与非线性动力学混沌理论与非线性动力学0303不确定性与艺术表达不确定性与艺术表达0404 通过随机和混沌元素的组合,探索不可预测性和无

    83、序之美。该理论挑战了传统美学中对秩序和对称的强调,主张通过偶然性和瞬间性表现艺术的独特美感和深层次意义。强调多维度融合,如强调多维度融合,如时间与空间的交织、时间与空间的交织、自然与科技的结合、自然与科技的结合、现实与幻想的交织。现实与幻想的交织。通过对人类情感、社通过对人类情感、社会问题和哲学思考的会问题和哲学思考的探讨,使作品不仅探讨,使作品不仅在在视觉上吸引人,更在视觉上吸引人,更在精神上引发共鸣和思精神上引发共鸣和思考。考。表现个体在自然或科表现个体在自然或科技面前的无力感,引技面前的无力感,引发对自我存在和环境发对自我存在和环境关系的反思。关系的反思。通过运用流动的线条、通过运用流动

    84、的线条、渐变的色彩和多变的渐变的色彩和多变的结构,赋予作品以生结构,赋予作品以生命力和动感。命力和动感。作品中的空间是多层作品中的空间是多层次、多维度的交织,次、多维度的交织,使观众在观赏中感受使观众在观赏中感受到空间的无限可能性到空间的无限可能性和变化性。和变化性。孤寂感的表孤寂感的表达达动态变化与动态变化与流动性流动性多维融合多维融合内在变幻内在变幻空间交错空间交错寂幻流寂幻流美学:静动交融美学:静动交融 孤幻流转孤幻流转 将孤寂感与动态变化、流动性和多维融合相结合;强调在作品中表达出深刻的孤寂感,通过视觉上的冲击力和内在情感的复杂交织,探索自然、科技与人类情感之间的关系。越极限美学:越极

    85、限美学:商商-古希腊古希腊汉汉-文艺复兴文艺复兴唐唐-巴洛克巴洛克宋宋-洛可可洛可可明明-印象派印象派海神颂杯海神颂杯圣羽蛇之冕圣羽蛇之冕青花流韵青花流韵瓷瓶瓷瓶波斯梦华地毯波斯梦华地毯法贝热蛋法贝热蛋孔雀宝座孔雀宝座花影流光杯花影流光杯AIGCAIGC海报:精准控制海报:精准控制 元素构成元素构成对图片各区域内容的精准控制对图片各区域内容的精准控制对大楼每一层展示内容的精准控制,包括农业食品、医疗设备、技术装备等,摆脱了AIGC内容不可控的问题,实现了对内容需求的精准表达。发布平台:中国国际进口博览会发布平台:中国国际进口博览会参与人工:参与人工:1 1 人人 -50%-50%内容类型:内容

    86、类型:AIGCAIGC海报海报应用工期:应用工期:2 2 天天 -50%-50%应用工具:应用工具:Stable DiffusionStable DiffusionAIGCAIGC修复:英雄不朽修复:英雄不朽 见证温暖见证温暖发布平台:新华社发布平台:新华社参与人工:参与人工:1 1 人人 -50%-50%内容类型:内容类型:AIGCAIGC图片图片应用工期:应用工期:2 2 天天 -50%-50%应用工具:应用工具:Stable DiffusionStable Diffusion对烈士形象进行修复对烈士形象进行修复综合使用AI技术,协助新华社在关于中国维和英雄杨树朋烈士的报道中,制作了一幅感

    87、动人心的“照片”:杨树朋烈士与他的家人,共同出现在一张温馨的全家福中。AI修复照片传达了深切的情感和对英雄不朽记忆的致敬,让我们得以突破天人之隔,见证烈士与家人团聚的温暖瞬间。AIAI自动化工作流:模型驱动自动化工作流:模型驱动 高效执行高效执行内容生成流程内容生成流程通过RPA自动化管理内容生成的各个环节,包括数据收集、处理和内容发布,AIGC负责生成具体内容。这使得整个流程高效、连贯,并减少了人为干预的需求,确保内容及时更新和发布。动态调整动态调整RPA实时收集用户互动数据,AIGC根据这些数据动态调整生成内容,提高内容的相关性和用户满意度。应用场景应用场景在个性化营销中,RPA和AIGC

    88、结合可以根据用户行为生成定制化广告内容;在自动化客服中,系统可以实时调整回复策略,提供精准服务。将人工智能(将人工智能(AIAI)技术与自动化流程()技术与自动化流程(RPARPA)相结合,借)相结合,借助助AIAI的智能决策、数据处理和分析能力,自动执行一系列的智能决策、数据处理和分析能力,自动执行一系列任务或操作,以达到高效、智能化的流程管理任务或操作,以达到高效、智能化的流程管理0101拥有意图识别、逻辑推理、抽象总结的能力,以适当的泛化能力生成相关内容大模型:生成式大模型:生成式AIAI0202把电脑和手机上的有逻辑规则、重复性的工作交给RPA软件机器人来执行影刀RPA RPARPA:

    89、机器人流程自动化:机器人流程自动化AIAI(思考决策)(思考决策)RPARPA(动作执行)(动作执行)全智能自动化机器人全智能自动化机器人3.33.3生成音乐生成音乐AIAI音乐:音乐:音符音符公式公式 数学共鸣数学共鸣外星人之歌自由规则性自由规则性模仿创新性模仿创新性情感计算性情感计算性知识创意性知识创意性 音乐教育和训练音乐教育和训练 音乐表演与互动音乐表演与互动 音乐治疗音乐治疗 作曲与编曲作曲与编曲 虚拟艺术家虚拟艺术家 音乐分析与分类音乐分析与分类AIAI音乐四性:智能创作音乐四性:智能创作 情感共鸣情感共鸣AIAI音乐:八层价值音乐:八层价值 乐道人心乐道人心创新与融合创新与融合无

    90、限创作潜力无限创作潜力个性化体验个性化体验分析与研究分析与研究保存与传承保存与传承教育与学习教育与学习跨领域融合跨领域融合治疗与放松治疗与放松AIAI音乐:异曲纷呈音乐:异曲纷呈 变幻莫测变幻莫测超器具音乐超器具音乐AI技术创造出完全不存在于现实世界中的虚构乐器的音乐。0101超风格音乐超风格音乐将多种音乐风格融合在一起的创作方法,超越单一风格界限进行音乐创作。0202情感疗愈音乐情感疗愈音乐这种音乐类型利用特定的旋律、节奏、和声和音色来激发、安抚或改变听众的情绪状态。0303状态感知音乐状态感知音乐结合状态分析技术,AI能够根据用户的实时状态创作相应的音乐,以引发或改变听众的心理。0404残

    91、章修复音乐残章修复音乐使用AI技术分析和重构损毁或不完整的历史音乐记录,复原古老音乐的原貌。0505高细节音乐高细节音乐重于产生和整合极高数量和复杂度的音乐细节,这些细节远超传统或一般AI生成的音乐作品。0606算法即兴音乐算法即兴音乐使用AI算法模拟即兴音乐演奏,AI分析大量即兴演奏数据并即时生成独特的即兴音乐作品。0707其他尚未知其他尚未知AIAI音乐种类音乐种类0808高细节音乐:细腻入微高细节音乐:细腻入微 层次分明层次分明在高细节音乐中,AI被用来创造、处理和组合大量的音乐元素,如旋律线条、和声变化、节奏模式、音色变化和动态层次,以创造出极富层次和深度的音乐作品。细节层次和复杂性细

    92、节层次和复杂性音乐中应包含大量的细节层次,这不仅限于旋律的复杂性,还包括和声、节奏、音色和动态的复杂性。多样性和创新性多样性和创新性高细节音乐应展示出在旋律发展、和声进程、节奏安排和音色设计等方面的多样性和创新性。情感表达和传达的深度情感表达和传达的深度包括音乐如何利用细节的丰富性来传达复杂的情感和故事,以及这些细节如何协助构建音乐的整体意境和情感影响力。遗落的星辰疗愈音乐:声波抚慰疗愈音乐:声波抚慰 曲调疗心曲调疗心情感识别情感识别AI系统可以分析用户的情绪状态,通过语音、表情、生理信号或行为数据来识别用户当前的情绪需求。音乐与情绪的交互音乐与情绪的交互AI可以实时调整音乐的元素,如节奏、旋

    93、律、音量和音色,以更好地与用户的情感状态相匹配,实现更加动态和互动的疗愈体验。个性化创作个性化创作基于用户情感状态的分析,AI能够定制或即时生成符合用户情感需求的音乐,例如,为焦虑的听众创作平静的音乐,或为悲伤的听众创作振奋人心的旋律。治疗效果的评估治疗效果的评估AI还可以通过用户反馈和持续的情绪监测来评估音乐疗愈的效果,以便不断优化音乐内容,更有效地满足用户的情感和心理需求。通过听觉体验促进情绪恢复和心理健康的音乐。这种音乐类型利用特定的旋律、节奏、和声和音色来激发、安抚或改变听众的情绪状态,从而达到疗愈的效果。情感疗愈音乐通常结合音乐疗法的原理,设计出旨在减轻压力、焦虑、抑郁等心理状况的音

    94、乐作品。Hello World,世界,你好,Hola Mundo,Bonjour le monde,Ol Mundo,Hallo Welt,世界,Ciao Mondo,Hallo Wereld,Merhaba Dnya,Xin cho Th gii,Witaj wiecie,Salut Lume,Hell Vilg,Ahoj svte,Hej vrlden,Hei maailma,Hej Verden,Hei Verden,Halo Dunia,Hai Dunia,Hello Mundo,Dia duit an Domhan,Tere Maailm,Sveika pasaule,Labas p

    95、asauli,Pozdravljen svet,Ahoj svet,Pozdrav svijete,语言融合:多元交汇语言融合:多元交汇 意境共鸣意境共鸣Hello worldHello world愿你的生活充满阳光和欢笑,未来的日子比今天更加灿烂!愿你的生活充满阳光和欢笑,未来的日子比今天更加灿烂!我团队我团队AIAI创作歌曲创作歌曲:做你的星光做你的星光 AI AI续写续写我团队我团队AIAI创作歌曲创作歌曲:逆风逆风3.43.4生成视频生成视频文生视频:五层价值文生视频:五层价值 绘声绘色绘声绘色美学价值美学价值社会价值社会价值情绪价值情绪价值时空价值时空价值消费价值消费价值001号AI

    96、微短剧中国神话由总台视听新媒体中心与总台人工智能工作室联合清华大学新闻学院元宇宙文化实验室制作,美术、分镜、视频、配音、配乐全部由AI完成,国内首部国内首部AIAI全流程微短剧全流程微短剧中国神话中国神话已经上线已经上线。该片获得001号微短剧网标。中国第一部中国第一部AIAI微短剧:中国神话微短剧:中国神话新华社新华社“说真相说真相”系列节目系列节目 该短片由我团队提供技术支持,是新华社首次尝试利用AIGC直接生成动态视频,推进视觉呈现技术向前一步,点击量突破百万。发布平台:新华社发布平台:新华社参与人工:参与人工:1 1 人人 -50%-50%内容类型:内容类型:AIGCAIGC视频动画视

    97、频动画应用工期:应用工期:2 2 小时小时 -80%-80%工具:工具:Midjourney+RunwayMidjourney+RunwayPrometheusPrometheus在在“20242024年国际学生媒体艺术节年国际学生媒体艺术节(ISMAISMA)”获得获得“最佳最佳AIAI电影剪辑奖电影剪辑奖”AIAI异世界熊猫异世界熊猫“探乐者探乐者”全球宣介片全球宣介片我团队我团队AIAI生成视频:生成视频:来江宁织造来江宁织造幸福幸福我团队我团队AIAI生成视频:生成视频:百年禁毒百年禁毒 为者为者必成必成我团队我团队AIAI生成视频:生成视频:哈尔滨文旅宣传片哈尔滨文旅宣传片 四四各行

    98、业应用各行业应用中国服装史上第一次中国服装史上第一次由AI设计服装,对接工厂生产,并由模特在全国大赛T台走秀展示,是改变我国服装历史的一刻。把潜在有潜在有变成可以有可以有,把可以有制造出来,变成实际有实际有。中国服装史的中国服装史的GPTGPT时刻:科技织梦时刻:科技织梦 秀场惊艳秀场惊艳平台效益:极速增效平台效益:极速增效 成本节减成本节减step 1step 2step 3step 4step 5step 6调研企划灵感构思物料准备设计绘图样衣制作打版调整确定主题确定主题理念、价值、元素、风格、用料团队头脑风暴团队头脑风暴打磨主题、扩展成衣细节、组成原色创意实验创意实验组合元素、筛选面料整

    99、理素材整理素材筛选整理创意、制成服装设计情绪板趋势调研趋势调研收集市场流行趋势、元素和衣服样式设计企划设计企划服装廓形、色彩、面料、图案、工艺细节产品企划产品企划上架时间、款式数量、品类结构、往季销售情况日程安排日程安排分工落地设计创意草图绘制草图绘制大量草图绘制、筛选款式花稿设计花稿设计面料印花或局部花样设计设计定稿设计定稿管理反馈意见并由设计师修改定稿款式图设计款式图设计单款的平面款设计图面辅料筛选面辅料筛选最终确定面料和辅料预估样品用量预估样品用量预估面辅料进货量面辅料调取面辅料调取寻找渠道、购货入库打样单制作打样单制作记录服装制作的大小、尺寸款式沟通款式沟通服装制版服装制版白胚出样白胚

    100、出样调整修改调整修改确认版型细节确认版型细节确认面辅料确认面辅料裁剪和缝制裁剪和缝制外发工艺加工外发工艺加工节约50%实验时间节约80%绘图和花稿时间节约50%设计企划时间成成 衣衣制衣流程制衣流程非凡衣着:创意画作非凡衣着:创意画作 幻想之幻想之裳裳促成医生、患者、促成医生、患者、医院三方满意局医院三方满意局面面关键技术知识产关键技术知识产权布局与市场布权布局与市场布局局促进学界、促进学界、医院、医院、行业、政府的合行业、政府的合作与联盟作与联盟产学研一体化的基础产学研一体化的基础与目标与目标循证医学循证医学 X A X AI I技术技术清华优势清华优势多维度产品开发多维度产品开发AI-MD

    101、TAI-MDT效效果数智跟踪果数智跟踪系统系统产学研结合产学研结合开发、应用、推广开发、应用、推广AI-MDTAI-MDT效果全面评估效果全面评估技术咨询与市场需求技术咨询与市场需求改进与推广改进与推广AI-MDTAI-MDT模型建构模型建构二、二、AIAI-MDTMDT效果跟踪平台建设效果跟踪平台建设MDTMDT数据库数据库三、三、AIAI-MDTMDT产学研一体化产学研一体化管理管理AIAI大语大语言模型言模型医工结合医工结合多学科交叉多学科交叉一、一、AIAI-MDTMDT系统建设系统建设市场趋势市场趋势关键技术关键技术人才培养人才培养学术成果学术成果市场产品市场产品建构建构测试测试推广

    102、推广医院医院智能智能高效高效试点试点患者患者医生医生精准精准患者评价患者评价医院品牌医院品牌市场需求市场需求医生评价医生评价+人人工工智智能能的的多多学学科科诊诊疗疗系系统统技技术术框框架架清华清华AI-MDTAI-MDT:多科诊疗:多科诊疗 协同决策协同决策 数据自动智能抽取录入:数据自动智能抽取录入:实现高效、高质量的临床研究数据录入和理解,减少人为错误的发生并减轻研究人员工作量。临床问题响应和知识点查询:临床问题响应和知识点查询:快速准确地提供临床问题答案和知识点信息,提升临床决策的效率。病例智能分析和决策支持:病例智能分析和决策支持:自动化病历数据分析,给出准确的医疗决策方案,以辅助医

    103、生进行诊断。多模态影像数据理解:多模态影像数据理解:高效、准确的肝胆多模态影像数据解析,提升诊断效率和精确度,并与现有报告进行对比分析。医疗大模型:病例分析医疗大模型:病例分析 判断支撑判断支撑生物医药大模型公司生物医药大模型公司水木分子水木分子累计已完成近亿元天使轮和种子轮融累计已完成近亿元天使轮和种子轮融资。资。募集资金将主要用于生物医药多模态大模型,以及对话式药物研发募集资金将主要用于生物医药多模态大模型,以及对话式药物研发助手工具助手工具ChatDD产品的研发。产品的研发。生物医药大模型:智能之光生物医药大模型:智能之光 造福人类造福人类对化学空间的高效搜索和生物活性预测,推动新药的发

    104、现和设计。模拟和预测个体或种群的生物行为。分析个体的生活习惯和健康数据,为用户提供个性化的健康生活建议。实时监控个体的生理数据,并预警可能的健康问题。通过对人类行为和语言的深度理解,揭示个体的心理状态,为心理健康管理提供支持。多模态编码对齐ChatDD-BIChatDD-DiscoveryChatDD-TrialChatDDChatDD-FM自然语言对话跨模态任务工具调用与CoT知识图谱分子单细胞预测蛋白质文本多能到超能多能到超能深度学习与高阶思维能力提升深度学习与高阶思维能力提升 通过深度学习和高阶思维能力培养,帮助学习者从具备多种技能状态发展到超高能力状态。AI可以提供高质量的学习资源,引

    105、导学习者深入研究特定领域,提高其创新能力、批判性思维和解决问题的能力。AIAI辅助学习与个性化教育辅助学习与个性化教育 通过个性化教育,帮助学习者从低能力状态迅速提升到高能力状态,即AI根据每个学习者的需求和优势定制教学内容和方法。单能到多能单能到多能跨学科学习与综合技能培养跨学科学习与综合技能培养 通过跨学科学习和综合技能培养,帮助学习者从具备单一技能状态发展到拥有多个成熟技能。整合各种领域的知识,为学习者提供更广泛的学习资源,帮助其掌握多种技能。超能到异能超能到异能拓展认知边界与创新思维模式拓展认知边界与创新思维模式 通过拓展认知边界和创新思维模式,帮助学习者从超高能力状态发展到异能状态。

    106、AI可以协助学习者挖掘潜在的认知能力,开发出前所未有的思维方式,以应对未来社会的挑战和变革。AI四能教育以以AIAI为基础,旨在帮助人们从低能为基础,旨在帮助人们从低能到高能、单能到多能、多能到超能、到高能、单能到多能、多能到超能、超能到异能的教育模式超能到异能的教育模式 低能到高能低能到高能教育教育大模型大模型:四能四能跃升跃升 认知突围认知突围AI AI 教育教育艺术设计教育艺术设计教育文学文化教育文学文化教育跨学科教育跨学科教育音乐音乐AI AI 写小说写小说医学医学视觉艺术视觉艺术戏剧和表演艺术戏剧和表演艺术舞蹈舞蹈多媒体和数字艺术多媒体和数字艺术AI AI 写剧本写剧本AI AI 文

    107、言文文言文AI AI 文稿文稿AI AI 写诗写诗AI AI 写论文写论文工艺和设计工艺和设计心理学心理学传播学传播学哲学哲学教育大模型教育大模型先问大模型平台先问大模型平台服装大模型平台服装大模型平台AI-MDTAI-MDT平台平台大模型多学科自动化评测平台大模型多学科自动化评测平台AI AI 智慧阁平台智慧阁平台技术基座技术基座技术底座技术底座自然语言处理自然语言处理多模态技术多模态技术深度学习深度学习机器学习机器学习AIGC AIGC 向量数据库向量数据库 大语言模型大语言模型 分布式计算分布式计算高性能高性能GPUGPU未来科技教育未来科技教育AIGCAIGC教教育育实实验验室室架架构

    108、构图图 清小搭清小搭:上学搭子:上学搭子 专属助手专属助手“清小搭”是基于最前沿的大模型智能体技术构建的学生智能助手。依托清华大学相关团队自研大模型和知识增强生成智能技术,不仅能够理解学生的需求,更能执行复杂任务,成为学习生活伙伴。校园生活指南学术顾问智能伴学个人成长记录AIAI课程作业:新术启教课程作业:新术启教 技技融学途融学途 构建理论的理论框架构建理论的理论框架理论构建学理论构建学 基于基于AIAI模拟的文明冲突仿真实验研究模拟的文明冲突仿真实验研究 基于基于SunoSuno制作的游戏制作的游戏BossBoss音乐音乐 基于基于AIAI对话的文学作品二次创作对话的文学作品二次创作 基于

    109、基于AIAI的群体智能对话:派对之夜的群体智能对话:派对之夜 AIAI城市拟人化处理与创意场景生成城市拟人化处理与创意场景生成 异世界的异感艺术异世界的异感艺术理论构建学是一个系统化系统化的学术领域专注于发展发展、评估评估和改进改进理论,以便更好地解释和预测现象1.发展发展函数 D函数 D 将概念集合 C 映射到理论 T,这表示从概念、数据和现象出发,构建出一个理论。2.评估评估函数 E函数 E 将理论 T 和一组评估资源 R 映射到一个评估向量 V。3.改进改进函数 I函数 I 将原有理论 T、评估向量 V 和基础知识和现象集合C映射到一个新的或改进的理论 T ,这表示基于多维度的评估结果对

    110、原理论进行修正和完善。协同智能框架下的宇宙文明大模型协同智能框架下的宇宙文明大模型心理心理大模型大模型:解读认知:解读认知 智渡险境智渡险境4 42 23 31 1预期预期成果成果心理疾病辅助诊疗平台心理疾病辅助诊疗平台通过多轮测试和论证证明该平台可以显著提升医疗决策的科学性、多学科联合会诊的高效性。AIAI虚拟心理医生虚拟心理医生研发AI虚拟心理医生助理,为妇女和儿童提供精准和个性化的心理健康诊断与治疗。医疗行业推广医疗行业推广 面向医疗系统,推广心理健康大模型服务体系。通过与政府部门、教育机构、非政府项目以及企业合作。科研成果发布科研成果发布收集和分析的大量数据,阐述AI技术诊断和治疗策略

    111、的有效性以及心理健康服务的最佳实践和创新方法。AIAI心理学:解读认知心理学:解读认知 智渡险境智渡险境AI AI 心理学心理学TexthereTexthere心理靶点(心理靶点(PsychologicalTargetsPsychologicalTargets)l心理靶点是影响个体心理健康和情绪福祉的关键因素。负面因素如压力、焦虑源,正面因素如情绪调节策略、社会支持网络。识别心理靶点有助于为个体设计有效的心理健康干预措施。倦怠靶点(倦怠靶点(Burnout TargetsBurnout Targets)l倦怠靶点指导致个体在心理和情感层面感到极度疲惫和消耗的特定因素或领域。包括过高的工作压力、

    112、不平衡的工作生活比例、缺乏社会支持等。靶向疗愈(靶向疗愈(Targeted HealingTargeted Healing)l靶向疗愈指针对个体特定的心理健康问题或倦怠靶点提供专门、个性化的治疗方案,旨在通过精准的干预措施促进快速和有效的康复。支持上传PDF、Word、数据文件等多类的文档;自动进行总结分析,根据用户需求搜索文档中的特定字段、数据等内容共同构成了一种综合性的AI 心理学研究框架,用于理解和解决个体的心理健康问题。通过识别心理和倦怠靶点,靶向疗愈能够提供更为精准和个性化的治疗方法。倦怠靶点可视为心理靶点的一个子集靶向疗愈是基于识别心理靶点(包括倦怠靶点)之后的一种治疗方法靶向疗愈

    113、在应对倦怠靶点方面发挥着重要作用AIAI心理疗愈:智愈心灵心理疗愈:智愈心灵 情绪导航情绪导航工业设计工业设计大模型大模型:创新发明:创新发明 加速突破加速突破概念确认指令执行概念生成思维导图创意工具思维导图创意工具项目启动初始设置与配置,定制初始设置与配置,定制化界面化界面研究分析数据搜集数据搜集AIAI分析分析设计和建模3D3D建模可视化呈现建模可视化呈现 AI驱动优化迭代改进反复审视和改进产品设计反复审视和改进产品设计协作评审云共享云协作云反馈云共享云协作云反馈预算计划项目参数项目目标性能模拟功能模拟迭代反馈性能测试最终设计验证时间市场研究用户研究技术研究性能评估设计优化市场预测设计调整

    114、性能测试合规检查最终确认复杂产品创新复杂产品创新大模型大模型:分析:分析优化优化 协作评审协作评审设备故障预测设备故障预测过程优化过程优化煤化工煤化工大模型:转型清洁大模型:转型清洁 持续发展持续发展原理:原理:通过集成物理化学原理、热力学、流体力学、反应动力学以及过程工程等多个学科的知识,对煤转化为化学品、燃料和其他高价值产品的复杂工艺流程进行量化描述和预测。目的:目的:优化煤化工过程的设计、运行和控制,提高资源利用效率,减少环境影响,并促进新技术的研发。清洁生产与流程优化清洁生产与流程优化 通过分析煤化工生产过程中的各项关键参数,AI模型优化工艺流程,减少排放,提升产品质量,符合意见中“提

    115、高用煤效能”和“推动清洁生产”之要求能耗与成本控制能耗与成本控制 对能耗和生产成本进行精准预测,帮助企业优化资源配置,控制成本,助力实现煤炭行业的集约高效开发,符合政策中的“推动节能降碳”的方向智能安全管理智能安全管理 通过大数据分析,识别生产过程中的潜在风险,提供实时的安全管理建议,符合“加快煤矿安全智能化”的政策指引,提升行业安全水平环保排放预测与治理环保排放预测与治理 模型预测生产中的环保排放指标,并提供优化方案,确保企业符合环保标准,推动“减污降碳协同治理”市场需求预测市场需求预测 通过对市场数据的智能分析,预测市场需求和价格走势,帮助企业灵活应对市场变化,提升市场竞争力,促进产业结构

    116、调整新产品研发与创新新产品研发与创新 AI模型加速新产品的研发与测试,提升创新能力,助力推动煤炭原料的多元化利用和新材料应用,契合政策中“推动煤基新材料应用创新”的要求通过仿真优化生产参数,提高产品质量与收率,助力清洁生产和能效提升整合上下游数据,推动供应链智能协作,提升行业竞争力和创新能力能源管理能源管理通过分析企业的能耗数据,提供节能减排方案,优化资源利用,实现成本控制和环保目标产业链同产业链同分析设备运行数据,预测故障并提前预警,提升生产安全性,符合智能化要求出版出版大模型:三审三校大模型:三审三校 独立操作独立操作AIAI出版出版提供自动生成内容、个性化推荐和智能搜索服务产品产品提供沉

    117、浸式阅读和学习体验,开发智能助手和语音交互功能,增强用户互动和便利性服务服务处于探索阶段,发展潜力大,面临技术研发成本高、用户隐私和版权保护等新挑战行业行业AI选题收稿翻译三审申领书号装帧设计排版校对质量检测征订出片下厂入库发货销售服务AI辅助传统模式自动检测语法错误内容一致性检查版权和引用验证敏感内容过滤三审三校大模型三审三校大模型AI文字出版物内容创作AI 图片出版物内容创作AI 音像出版物内容创作AI工具实操培训AIAI生成内容服务生成内容服务虚拟作者互动阅读体验品牌形象代言跨媒介推广AIAI出版虚拟人出版虚拟人AI智能书籍AI人形机器人AI出版智能硬件AI出版智能产品周边AI AI 智

    118、能硬件智能硬件读者画像与内容偏好分析自动化营销海报视频生成生成营销脚本文案智能营销平台AIAI出版营销出版营销AIAI智能图书智能图书融合了AI技术与传统阅读材料,内置了高级的AI功能,能够提供互动式的学习体验。虚拟作者虚拟作者完全独立操作的AI虚拟人,不仅生成内容,还能模拟特定的写作风格和声音。这些AI作家可以创作小说、新闻报道、博客文章等,完全无需人类干预。文旅大模型:游客共情文旅大模型:游客共情 走进现实走进现实文旅大模型从文化、历史、景区、游客等数据中而来,想游客所想、答游客所问。文旅大模型从文化、历史、景区、游客等数据中而来,想游客所想、答游客所问。AIGCAIGC打开游客想象力和创

    119、造力,让游客大开眼界,看不一样的视频、设计,又让游客心想打开游客想象力和创造力,让游客大开眼界,看不一样的视频、设计,又让游客心想事成,化身神笔马良、音乐大师。事成,化身神笔马良、音乐大师。AI创造文化加持社交:社交:特定人设,持续输出内容,与游客高频交互,强化情感连接。人格人格:高度人格化,构建真实场景,走近游客生活,提供互动和陪伴。娱乐娱乐:花样技能,炫酷形式,邀请游客参与,提供情绪价值。服务服务:贴心服务,温声细语解答,耐心细致导览,提供附加价值。场景:场景:丰富的场景,为商业合作提供创意空间,展现虚拟人独特人设。跨元:跨元:虚拟人不受限,具备广阔的内容扩展空间,连接真实与虚拟。文旅虚拟

    120、人文旅虚拟人会讲延安故事的明信片会讲延安故事的明信片 延安旅游集团联合壹宇宙开发的“AIAI寻城迹寻城迹延安延安”明信片文创产品基于AIGC,集MetaBox+影像AI修复、图像活化、数字人驱动、AR视觉增强等技术为一体,将AI算法与卡片数实融合,让老照片“动起来”,历史人物“活起来”,呈现明信片在看、听、玩、用等层面的全新交互体验。AIGC为延安老照片赋予了“新生命”,为文旅商消费注入了新动能。文旅大模型:虚拟服务文旅大模型:虚拟服务 最后一米最后一米虚拟人虚拟人+官网官网交互一体机交互一体机+虚拟人虚拟人核心技术:人脸识别、情绪识别、人脸唤醒、语音唤醒、语音交互等。将文旅虚拟人部署至一体机

    121、终端设备,为游客创造更为沉浸式、个性化的交互体验。APP+虚拟人小程序+虚拟人公众号+虚拟人智慧大屏智慧大屏+虚拟人虚拟人打破传统服务模式,可以多点部署、统一管理,快速响应游客个性化需求,突破人力、时间、空间服务限制,在游客与景区之间搭建多条服务桥梁。新媒体终端新媒体终端+虚拟人虚拟人舆情大模型舆情大模型SAASSAAS:洞察全局:洞察全局 精准应对精准应对英语Englisish西班牙语Espaol法语Franais德语Deutsch俄语P阿拉伯语葡萄牙语Portugu.AIGCAIGC与传媒:交互多元与传媒:交互多元 趣味盎然趣味盎然AIGCAIGC新闻新闻传统新闻传统新闻无记者新闻无记者新

    122、闻1.1.数据汇集,精准抓取数据汇集,精准抓取2.2.快速组稿,精准加工快速组稿,精准加工3.3.热点追踪,传播分析热点追踪,传播分析优优点点1.1.模式固定、适用面窄模式固定、适用面窄2.2.缺乏思考能力缺乏思考能力3.3.缺乏创造力缺乏创造力缺缺点点对话新闻对话新闻1.1.内容可靠性高,质量较高内容可靠性高,质量较高2.2.报道更深度、全面报道更深度、全面3.3.提供一定解读和分析提供一定解读和分析1.1.时间和人力成本较高时间和人力成本较高2.2.受记者主观因素的影响受记者主观因素的影响3.3.存在偏见或失实的风险存在偏见或失实的风险1.1.可短时间内大量生成可短时间内大量生成2.2.客

    123、观性和中立性较高客观性和中立性较高1.1.可能存在数据误解和错误可能存在数据误解和错误2.2.报道和分析深度性、全面报道和分析深度性、全面性不足性不足1.1.更具人性化和针对性更具人性化和针对性2.2.提供与用户的互动和反馈提供与用户的互动和反馈1.1.精准度和逻辑性问题精准度和逻辑性问题2.2.大量训练数据和算法支持大量训练数据和算法支持3.3.大量人力和资金投入大量人力和资金投入以对话的形式呈现新闻。通常有两个或多个角色,通过交流观点和分析来呈现新闻事件。更具交互性、立体性和趣味性。通过机器人、AI等自动化技术来收集、编辑和发布新闻的方式。无需人力,能够快速、准确地发布新闻,并减少人为干预

    124、。自动识别和分类新闻,对新闻进行真假判断、溯源追踪与辟谣发布。数字驱动,提高辟谣准确率,帮助公众及时了解和纠正虚假信息。1.1.数据驱动,提高效率数据驱动,提高效率2.2.全时覆盖,及时反应全时覆盖,及时反应1.1.容易产生误判容易产生误判2.2.缺乏人性化思维缺乏人性化思维3.3.需要大量的数据训练需要大量的数据训练辟谣新闻辟谣新闻AIAIGCGC与与移动互联网移动互联网:场景延展:场景延展 体验升级体验升级 将AIGC技术深度融入主流移动互联网应用(搜索引擎、APP、社交媒体、消费、信息服务),有望实现功能互补、智能协同,通过双向赋能提供更丰富、更智能的服务体验,为企业创新和数字化转型注入

    125、新动能。通过嵌入通过嵌入AIGCAIGC技术技术各类互联网应用在用户体验、内容生成与推荐、交互服务等方面将实现显著提升与创新。各类互联网应用在用户体验、内容生成与推荐、交互服务等方面将实现显著提升与创新。互置可行性评估六大维度互置可行性评估六大维度技术维度技术维度技术兼容性、集成难度、系统稳定性等功能维度功能维度功能拓展、交互优化、智能增值服务等数据维度数据维度数据交互、实时更新、数据安全与隐私保护等用户体验维度用户体验维度互体验、个性化服务、用户满意度等商业维度商业维度商业模式创新、盈利能力、市场竞争力等法律和伦理维度法律和伦理维度法律合规、伦理道德、用户权益保护等 AIGC+搜索引擎:提升

    126、搜索质量,实现交互式和对话式的搜索体验。AIGC+社交媒体:增强内容推荐,提供智能回复和内容生成等功能。AIGC+在线购物:优化商品推荐,提供智能购物助手服务。AIGC+音乐和视频流:提升推荐算法,实现个性化推荐。AIGC+新闻和信息服务:实现智能摘要、个性化推送等。G Gr ro ok k2 2的的主主要要特特点点数据全真数据全真智绘爆发智绘爆发多维交互多维交互利用社交媒体,特别是X(原Twitter)作为其数据源,提供最新、最相关的增量信息,能够及时反映新闻、事件和社交媒体趋势。集成FLUX.1模型,大幅提升图像生成能力,采用创新混合架构,结合多模态处理和并行扩散机制,拥有120亿参数。娱

    127、乐模式:提供幽默、前卫的互动体验。常规模式:专注于提供准确、专业的信息。大模型在社交媒体的具体应用大模型在社交媒体的具体应用大模型大模型&社交媒体未来挑战社交媒体未来挑战 情感适配内容生成情感适配内容生成:通过情感驱动的机制直接优化内容 自我学习的舆情预测:自我学习的舆情预测:在没有明确规则的情况下感知舆情变化,并自主调整应对策略 内容创作民主化:内容创作民主化:帮助没有专业技能的用户创作出高质量的内容,激发用户创造力 社交营销:社交营销:预测潜在的社交关系,发现潜在社区热点,并主动发起话题讨论 智能审核:智能审核:快速识别与过滤不良信息,维护社区秩序 错误信息或偏见风险 隐私与数据保护问题

    128、技术监管与政策法规挑战AIGCAIGC与社交媒体:智能生成与社交媒体:智能生成 增强交互增强交互AIGCAIGC与虚拟人:多模支持与虚拟人:多模支持 定制服务定制服务 大语言模型大语言模型LLM+LLM+多模态多模态支持支持:自然语言的交互方式、声音、图片、视频、3D资产等多种支持降低创作成本真人听观虚拟人真人-虚拟人多模态交互解放模特服饰/表情/动作MJ快速生成IP形象LLM赋能智慧具备特殊知识与表达的名僧原画-3D-真人转化链构成可逆环重构资产转化链重构视频流形象无特定知识倾向的元梦成文化项目个性化定制形 象 定 制多 种 形 态丰 富 表 情2D、3D、卡通、年龄、性别、穿搭服装库、动作

    129、库、半身/全身、多视角表情、嘴型、肢体动作声 音 定 制A I 大 脑实 时 合 成复刻声音、海量音库提供私有化、共有云服务、SDK接口调用多语种、虚拟播报、一键合成虚拟人将成为主流服务虚拟人将成为主流服务UIUI元娲 METAWA.CN形象定制:智能使者形象定制:智能使者 未来伙伴未来伙伴城市形象数字人城市形象数字人:虚拟雅韵:虚拟雅韵 未来无限未来无限 AIAI与与ARAR:轻量突破:轻量突破 消费升级消费升级2023年,Meta 联合雷朋推出的Ray-Ban MetaRay-Ban Meta智能眼镜增加了摄像、耳机与AI 功能,自去年十月发售起,已经在全球销售了超 100 万台。2024

    130、年推出的OrionOrion是Meta首款全息增强现实眼镜,以100克左右的重量实现了微型高级计算机的能力,眼镜视野达70度,拥有迄今为止最小AR眼镜中的最大视野,能支持手势和眼动追踪,提供沉浸式体验。Orion集成了全息显示技术和个性化AI助手,与眼镜配套的是一款革命性神经腕带,能够解读用户的脑电波。Orion眼镜Meta 雷朋眼镜AIGCAIGC与元宇宙与元宇宙:虚拟学府:虚拟学府 元筑梦想元筑梦想具身概念逐步得到验证,通用人工智能AGI开始启程。可达性可达性:基本要素可测量。可检验性可检验性:可用完成任务检验。可解释性可解释性:可通过具身学习推断概念。AIGCAIGC与具身智能:模型助推

    131、与具身智能:模型助推 验证验证功能功能AI计算机计算机视觉视觉自然语自然语言处理言处理认知与认知与推理推理机器人机器人学习学习博弈与博弈与伦理伦理机器学机器学习习具身感知具身感知具身想象具身想象具身执行具身执行实施方案实施方案大模型加入大模型加入物体知识库物体知识库交互式交互式物体感知物体感知仿真引擎仿真引擎通用物体抓取通用物体抓取AIGC与空间智能:与空间智能:场景重构场景重构 智慧赋能智慧赋能 2024年初,中国AI初创企业VAST发布3D生成大模型Tripo 1.0,9月推出Tripo 2.0,目前可做到10秒生成形状几何,10秒成纹理及PBR(基于物理的渲染),在3D生成任务效果中处于

    132、领先地位。空间智能是机器在三维空间和时间中以三维方式感知、推理和行动的能力,即理解事物在三维空间和时间(4D)中的位置,事物的交互方式。旨在将 AI 从大型数据中心带出来,放入 3D/4D 世界中,使其理解这个世界的丰富性。空间智能应具备四个关键能力:场景理解、物体识别、空间关系推理和交互式感知。美国国家工程院院士李飞飞AIGCAIGC与人形机器人:人性深化与人形机器人:人性深化 应用广延应用广延 人形机器人导航:人形机器人导航:结合视觉、语音等,协助人形机器人推断出最可能的导航路线。人形机器人交互:人形机器人交互:结合自然语言处理、计算机视觉等技术,使机器人更好地理解人类的语言和行为,预测人

    133、类意图。情感表达:情感表达:人形机器人通过面部表情、肢体语言等方式表达情感,并通过AIGC技术来优化其情感表达的真实性和逼真感。自主学习:自主学习:让人形机器人从环境中学习并不断完善自己的行为和决策。使之更加智能化和自适应,并在未知环境中做出更好的决策。机遇机遇 深度智能化深度智能化 自然交互能力自然交互能力 应用领域延伸应用领域延伸 商业化加速商业化加速 人形机器人是模仿人类的形状、结构、行为以及实现人类基本动作和功能的智能机器人,具备感知环境、进行决策和执行动作的能力,其应用领域涵盖服务、医疗、娱乐等领域。应应用用人形机器人人形机器人:未来科技未来科技 新式新式交互交互 埃塞俄比亚总统顾问

    134、Dr.Arkebe Oqubay 和夫人到我们机器人团队考察交流。如:如:AIAI预测中美博弈预测中美博弈AIAI预测技术发展趋势预测技术发展趋势AIAI预测预测俄乌战争俄乌战争技术急变技术急变AIAI预测与人类智慧的融合,通过深度对话创造独特的预测未来方式预测与人类智慧的融合,通过深度对话创造独特的预测未来方式协助政府部门精准治理为事件应对提供支持提前制定应对策略AIAI预测:智能演进预测:智能演进 观势生变观势生变AIAI测评:高效全维测评:高效全维 自动校验自动校验 两项国家级项目:2023国家自然科学基金青年项目“面向人工智能生成内容的风险识别与治理策略研究”2023国家资助博士后研究

    135、人员计划B档“AIGC意识形态安全评测与治理策略研究”AIGC(人工智能生成内容)正在从根本上重构新闻业,影响包括新闻内容的创造、新闻主体的角色、新闻平台的运营方式,以及整体新闻技术的应用。AIGCAIGC重构新闻业:四大维度重构新闻业:四大维度 极大革新极大革新新闻内容新闻内容的创造的创造新闻主体新闻主体的变化的变化新闻平台新闻平台的发展的发展新闻技术新闻技术的革新的革新AI与其他技术的融合技术的民主化和普及多平台内容同步发布平台间的竞争和合作新闻机构的角色转变新闻工作者的技能需求变化新兴参与者的加入增强内容的多样性和丰富性提升内容的个性化水平提高报道的实时性模型测评:三十层级模型测评:三十

    136、层级 智力推演智力推演评测AI大模型智力水平可分为三十层级。其中,1-15级按照人类的学习和职称水平层层递进,16-30则是超越爱因斯坦智力水平、颠覆人类认知的完全智能体。基 础 感 知 与 模仿1-31-3岁岁基 础 问 题解决中学生中学生初级预测与分类小学生小学生专业领域内容创新大学生大学生语言理解与简单创新3-63-6岁岁颠 覆 性 理 论或框架构建教授教授实现跨学科研究推动引领学术新思潮副教授副教授数据分析与模型优化硕士生硕士生算法与技术创新博士生博士生开发新应用与问题解决助理教授助理教授基础感知响应0-10-1岁岁特 点 研 发 领域 实 现 科 技之最国家最高科国家最高科技奖技奖院

    137、士院士科 学 界 疑 难问 题 革 命 性推动诺贝尔奖获得者诺贝尔奖获得者颠 覆 现 有 知识体系爱因斯坦级爱因斯坦级院士院士AIAI与哲学与哲学 伦理悖论实验:设计一些伦理悖论情境,让AI进行模拟决策,研究道德判断与伦理意识。意识模拟:探讨AI在自我意识和他者意识上的表现,模拟不同程度的“自我”概念。极限心理与社会实验极限心理与社会实验 多重人格模拟:通过AI模拟多重人格障碍中的行为和决策,分析不同人格状态下的表现。乌托邦与反乌托邦:构建理想社会与反乌托邦社会,观察这些极端社会中可能的适应和互动。复杂系统模拟复杂系统模拟 AI模拟生态系统:创建一个复杂的生态系统模型,观察AI如何预测和管理生

    138、态系统中的相互作用和突变。经济模型模拟:模拟不可能的经济现象,如无限增长经济体,分析这种环境下的行为和决策。虚构物理法则实验虚构物理法则实验 引力反转世界:模拟一个引力方向不断变化的环境,研究如何适应和重新路径规划。时间悖论模拟:模拟“祖父悖论”等时间旅行中的经典悖论,研究时间矛盾和因果关系。不可能的任务不可能的任务 无限迷宫:设计一个不断变化和扩展的迷宫,探索如何解决和适应永远无法完全探索的环境。量子计算谜题:利用量子计算的特性,创建需要量子思维方式才能解决的问题。AIAI模拟数据:模拟数据:悖境研析悖境研析 极限探索极限探索AIAI数据伦理数据伦理:智权重议:智权重议 数界新序数界新序数据

    139、作为一种新的主体数据作为一种新的主体数据在被收集、分析、利用的过程中逐渐展现出一种“主体性”,不再仅仅是信息的载体,而成为了具有能动性的“实体”。隐私边界的重新定义隐私边界的重新定义个人对自身数据的控制权逐渐减弱。信息泄露风险增大,数字足迹难以抹去,个体隐私与公共利益难以平衡。谁在操控我们的数字命运?谁在操控我们的数字命运?算法对个体的信息获取、生活方式乃至人生轨迹等方面发挥着越来越大的影响,个人的数字生活逐渐脱离了自主掌控,而被外部力量所左右。谁来为机器的决定买单?谁来为机器的决定买单?机器不仅能够基于既有数据做出决策,还能创造出全新的数据。机器决策过程变得更加复杂,当基于AI生成数据的决策

    140、导致不良后果时,责任的归属变得更加模糊。后人类时代,AI生成数据挑战了传统的人类中心主义,探讨人机共存背景下新的伦理规范迫在眉睫。AIAI数据特点:数据特点:高度仿真性:高度仿真性:生成数据与真实数据极为相似,甚至难以区分。多样性:多样性:可以生成大量多样化数据,满足不同场景的需求。可控性可控性:通过调整模型的参数,可以控制生成数据的风格、内容和质量。界限模糊性:界限模糊性:技术发展:技术发展:生成的图像、文本等越来越逼真。数据复杂性:数据复杂性:现实世界中的数据本身就存在着噪声、不确定性等因素。认知局限性:认知局限性:人类在判断信息真伪时,易受到主观因素、先验知识等的影响。AIAI生生成成数

    141、数据据与与真真实实数数据据的的界界限限模模糊糊性性后人类主义视角下的数据伦理后人类主义视角下的数据伦理文生小程序:智能编程文生小程序:智能编程 创新驱动创新驱动AI生成代码的技术借助自动化与智能化的功能,为非编程人员提供了简易的开发工具,让他们能专注创意,避免了学习复杂编程语言的障碍。对专业开发者来说,这不仅能减少手动编码,加快开发速度,提升代码质量,还促进了设计与开发的协作,从而提高效率,使他们能更多地投入高层次的创新和业务逻辑构建。AI文生小程序:使用AI工具输入提示语,按照AI给出的步骤操作即可生成小程序AI对话生小程序:用户通过简单的文本描述即可在线自动编写运行代码生成小程序AI图片生

    142、小程序:用户通过上传设计图即可在线自动编写运行代码生成小程序开源大数据:两千亿数据开源大数据:两千亿数据 年产年产3535万份数据报告万份数据报告中文数据量中文数据量1700亿条亿条 2016年上线智能简报自动生成系统,2022年升级为多行业领域研判报告辅助生成系统(文曲星)实现逻辑:主题监测主题监测全平台采集全平台采集语义分析语义分析内容拆分内容拆分模板选择模板选择文字润色文字润色简报导出简报导出Cursor Cursor:智能代码智能代码 编写助手编写助手自动错误检测自动错误检测实时检测代码中的错误,并提供修正建议,减少调试时间,提高代码质量。高高一致性一致性基于对整个项目的理解,提供一致

    143、性更高的代码建议,适合大型复杂项目。文档与注释生成文档与注释生成自动生成代码文档和注释,帮助用户更快理解复杂代码,提升代码的可维护性。编辑器支持编辑器支持作为独立编辑器或集成到现有编辑器Cursor不仅生成代码,还能对现有代码进行智能优化,提升整体代码质量。Cursor是一款智能编程助手,它可以提高开发者的编码效率,通过人工智能帮助用户进行代码编写、错误调试和项目管理等场景。GitHuGitHub b CopilotCopilot:AIAI辅助辅助 高效高效编码编码GitHub Copilot 是由 GitHub 和 OpenAI 开发的智能编程助手,旨在通过 AI 技术为开发者提供代码建议和

    144、帮助,提升编程效率和代码质量。支持从简单的代码自动补全到更复杂的多行代码片段生成。支持Python、JavaScript、TypeScript、Go、Ruby 等编程语言,适用于各类项目和开发需求。社区交流社区交流通过Issue和Discussion功能,用户可以与社区互动,获取反馈并解决编程问题。基于 OpenAI 的模型,生成代码片段、函数和整段代码。通过学习代码库和开发者的编码风格,生成上下文相关的建议。集成范围集成范围广广支 持 在 V S C o d e、JetBrains 系列等主流 IDE 中安装插件使用,快速集成到现有开发环境中。AIGCAIGC驱动下驱动下的的移动互联网移动互

    145、联网 将AIGC技术深度融入主流移动互联网应用(搜索引擎、APP、社交媒体、消费、信息服务),有望实现功能互补、智能协同,通过双向赋能提供更丰富、更智能的服务体验,为企业创新和数字化转型注入新动能。通过嵌入通过嵌入AIGCAIGC技术技术各类互联网应用在用户体验、内容生成与推荐、交互服务等方面将实现显著提升与创新。各类互联网应用在用户体验、内容生成与推荐、交互服务等方面将实现显著提升与创新。互置可行性评估六大维度互置可行性评估六大维度技术维度技术维度技术兼容性、集成难度、系统稳定性等功能维度功能维度功能拓展、交互优化、智能增值服务等数据维度数据维度数据交互、实时更新、数据安全与隐私保护等用户体

    146、验维度用户体验维度互体验、个性化服务、用户满意度等商业维度商业维度商业模式创新、盈利能力、市场竞争力等法律和伦理维度法律和伦理维度法律合规、伦理道德、用户权益保护等 AIGC+搜索引擎:提升搜索质量,实现交互式和对话式的搜索体验。AIGC+社交媒体:增强内容推荐,提供智能回复和内容生成等功能。AIGC+在线购物:优化商品推荐,提供智能购物助手服务。AIGC+音乐和视频流:提升推荐算法,实现个性化推荐。AIGC+新闻和信息服务:实现智能摘要、个性化推送等。AIGCAIGC驱动的多模态融合创新应用驱动的多模态融合创新应用 多模态融合多模态融合是指将来自多个不同类型(例如文本、图像、声音等)的数据合

    147、并,利用跨模态技术产生一个综合的数据表示或输出,代表一种全新、流畅和高效的人类交互体验,其核心挑战是如何有效地融合这些模式以提供连贯和有意义的输出。在实际应用中,AIGC可以根据用户的需求,实现各个模态数据间的相互转换,例如:夏日的海滩日落图夏日的海滩日落图海底世界海底世界静态转为动态静态转为动态地标识别地标识别足球解说足球解说文本生成图像文本生成图像文本生成视频文本生成视频图像生成视频图像生成视频图像理解图像理解视频理解视频理解复杂任务的复杂任务的自动化工作流自动化工作流内容生成流程内容生成流程通过RPA自动化管理内容生成的各个环节,包括数据收集、处理和内容发布,AIGC负责生成具体内容。这

    148、使得整个流程高效、连贯,并减少了人为干预的需求,确保内容及时更新和发布。动态调整动态调整RPA实时收集用户互动数据,AIGC根据这些数据动态调整生成内容,提高内容的相关性和用户满意度。应用场景应用场景在个性化营销中,RPA和AIGC结合可以根据用户行为生成定制化广告内容;在自动化客服中,系统可以实时调整回复策略,提供精准服务。将将AIGCAIGC技术与自动化流程(技术与自动化流程(RPARPA)相结合,利用)相结合,利用AIGCAIGC的智能决策、数据处理和分析能力,实现任务的自动的智能决策、数据处理和分析能力,实现任务的自动执行,从而达成高效、智能化的流程管理,推动企业运营创新与效率提升。执

    149、行,从而达成高效、智能化的流程管理,推动企业运营创新与效率提升。0101拥有意图识别、逻辑推理、抽象总结的能力,以适当的泛化能力生成相关内容AIGCAIGC:人工智能自动生成内容:人工智能自动生成内容0202把电脑和手机上的有逻辑规则、重复性的工作交给RPA软件机器人来执行影刀RPA RPARPA:机器人流程自动化:机器人流程自动化AIGCAIGC(思考决策)(思考决策)RPARPA(动作执行)(动作执行)全智能自动化机器人全智能自动化机器人AIGCAIGC人机共生引擎:分层生成人机共生引擎:分层生成 多元协作多元协作用户需求输入 创意分层生成模型(文、图、乐、视频生成)价值观对齐模块(多轮优

    150、化与文化适应)国内外大模型整合(支持多语言与多样性)编辑与辅助工具(高效创作支持)输出成品内容(标准化与定制化内容)创意分层生成模型创意分层生成模型基础层:处理原始输入数据,生成短文、草图或旋律片段。中间层:完成逻辑整合,如情节连贯性、视觉结构或音乐和弦编排。高层:进行风格化处理与个性化调整,使生成结果更符合市场或用户的需求。采用多层级生成逻辑,从简单素材(如文字片段、图像草稿)逐步构建复杂成果价值观对齐模型价值观对齐模型文化对齐:通过人类反馈持续优化内容,提高输出的多样性与相关性。反馈与迭代:根据不同地区或行业需求、动态调整生成结果的表现形式。AIGC生成内容需要符合文化、伦理和社会价值体系

    151、,通过反馈循环机制,使其满足客户与市场需求国内外大模型整合国内外大模型整合多模型支持:根据需求调用多类型大模型,提升生成内容的广泛性和创新性,支持多语言与多风格的内容生成。内容编辑与辅助工具内容编辑与辅助工具实时编辑:用户可随时调整AI生成内容,并通过工具优化细节。工作流优化:为不同内容创作场景提供专门的流程模板。引擎整合一系列内容编辑工具,提升用户的创作效率,工具涵盖文、图、乐、视频各领域,以实现高效的协作与成果输出五五未来展望未来展望低替代性低替代性高替代性高替代性低协作性低协作性高协作性高协作性低替代性,高协作性低替代性,高协作性职业的替代性较低,但AI协作的潜力很大。AI不能完全取代这

    152、些职业,但能显著提升其效率、效果或创新能力。高替代性,高协作性高替代性,高协作性职业具有较高的替代性,AI能够承担许多任务;同时可以通过协作进一步提升职业表现。低替代性,低协作性低替代性,低协作性职业的替代性和协作性都较低,通常因为任务具有高度的独特性或艺术性,AI对其增效有限。高替代性,低协作性高替代性,低协作性职业的替代性高,且协作潜力低,AI能够完全或大部分取代人类工作。职业替代:辅助创新职业替代:辅助创新 协作增强协作增强 社会形态:技术革新社会形态:技术革新 智力汇聚智力汇聚 社会形态社会形态核心特征核心特征主要职业主要职业职业特点职业特点农业社会农业社会大部分人大部分人供养少部分人

    153、少部分人(农民阶级 VS 地主阶级)农牧业生产者农牧业生产者 手工业者(木匠、铁匠、陶工等)商人 工匠与技艺者(制衣、建房等)以农业为中心 以手工和小规模生产为主 社会分工简单工业社会工业社会大部分人大部分人供养大部分人大部分人(工人阶级 VS 社会大众)制造业工作者制造业工作者 工程师和技术人员 白领工作者(管理人员、文员、会计等)服务行业人员(教师、医生、律师等)工业化和机械化 劳动分工专业化 服务业兴起AIAI社会社会少部分人少部分人供养大部分人大部分人(技术精英 VS 普通民众)智能化从业者智能化从业者 创意工作者(设计师、艺术家等)AI工程师和数据科学家 远程工作者和自由职业者 智能

    154、化和数字化 知识密集型和创意导向 工作方式灵活、远程化经济变化:智造升级经济变化:智造升级 资源倾斜资源倾斜 市场从固定走向灵活,通过数据和技术进行策略优化,但也可能导致市场的同质化0303010104040202从人力驱动到智能化生产,显著提高生产效率,但现阶段也伴随着就业机会的减少从传统产业到新兴产业的升级,实现产业优化升级,但传统行业可能面临逐渐萎缩的风险产业发展资源从广泛向集中方向转变,通过科技手段实现精准分配,但可能会导致科技资源过度集中资源分配通过数据驱动的方式,帮助政府和组织在政策和战略制定过程中提高效率和准确度,但同时面临缺乏透明度、难以追责的挑战。通过智能监控和资源管理系统,

    155、提升社会治理效率和优化资源分配,但可能存在侵犯隐私、提高社会监控力度的问题。通过精准的内容推荐和舆论引导机制,优化公众的参与和信息共享,但虚假信息和引导性传播也可能带来负面效应。应用数据分析技术对选举过程和民意进行精准的分析与评估,从而提高选举公正性,但信息操控可能影响公平性和透明度。利用智能工具与网络安全技术,提升国家在应对和防范网络攻击上的能力,但也增加了网络安全相关的风险和漏洞。信息传播信息传播选举管理选举管理社会治理社会治理安全防御安全防御智能决策智能决策政治冲击:政策高效政治冲击:政策高效 风险并存风险并存总体趋势总体趋势AI提升了政治效率和精准度,但也引发透明度不足、隐私侵害和舆论

    156、操控等挑战。0101结构权力结构权力从集中式治理到去中心化、数据驱动转移。0202关系权力关系权力从传统媒介到社交平台和算法推荐转移。0303资源权力资源权力从传统资源控制到数据和算力掌控者转移。0404认知权利认知权利从人类专家到算法和 AI 生成内容转移。0505创新创新权力权力从传统工业创新到技术公司和 AI 驱动创新转移。权力转移:算法主导权力转移:算法主导 技术赋权技术赋权60545442454046465855020406080100120结构权力结构权力关系权力关系权力资源权力资源权力认知权力认知权力创新权力创新权力各领域的权力转移:传统 vs AI影响AI影响传统权力文化重塑文

    157、化重塑:从传统创作到智能生成,打破了创作的限制。社会变革社会变革:从人力驱动到智能协作,提升社会治理效率,实现智能化管理,但可能加剧社会的不平等和失业风险。伦理挑战伦理挑战:从传统道德到技术争议,推动了伦理思考和隐私保护的标准化,但引发隐私泄露和数据滥用的伦理问题。从被动学习到智能获取知识,提高了知识获取的效率和个性化学习体验,但可能导致信息不对称的问题加剧。01010202健康医疗健康医疗:从传统医疗到智能健康管理,提高了医疗的精准性和预防水平,但也带来了数据隐私和技术依赖的问题。030304040505环境管理环境管理:从被动保护到智能管理,提升了环境保护效率,但可能产生新型环境问题,如技

    158、术废弃物。0606文明蜕变:文明蜕变:认知跃进认知跃进 利弊共存利弊共存生活方式:个性定制生活方式:个性定制 便捷高效便捷高效总体趋势总体趋势AI推动生活各个领域朝着智能化、个性化、便捷高效、虚拟沉浸和健康可持续的方向发展,提升了便利性和舒适度。方式方式变化趋势变化趋势衣衣从传统服装选择到AI个性化推荐与虚拟试穿,让穿衣更智能便捷。未来3D打印和虚拟购物将实现全方位个性化时尚。食食从家庭烹饪到智能推荐和无人餐饮服务,AI根据健康状况推荐食谱并自动烹饪提升饮食效率。住住从人工管理居住环境到智能家居和自动化生态住宅,更节能健康。行行从人工交通规划到智能导航与无人驾驶,提升交通安全与便利。玩玩从传统

    159、娱乐到AI个性化推荐娱乐内容,虚拟世界逐渐成熟,娱乐、社交、学习融合,让生活更丰富多样。AI对生活方式领域的影响从面对面的人际交流转变为个性化推荐人机互动愉悦加深。由家庭和社会支持过渡到网络心理咨询和AI情感识别的安慰。从传统面对面的直接表达转变为社交平台上的情绪放大,情感对立随算法推荐而加强。科技进步频繁带来新奇体验,未来对技术探索的惊讶感常态化,可能逐渐产生“惊讶疲劳”。从自然灾害、疾病等传统恐惧来源转向隐私和安全问题的焦虑。从对生活改善的朴素期待逐渐转向对AI和技术福祉的憧憬,未来趋向理性平衡,更关注AI与人类共存的可能性。愉悦愉悦悲伤悲伤愤怒愤怒惊讶惊讶恐惧恐惧期待期待情感变迁:智能陪

    160、伴情感变迁:智能陪伴 人机共情人机共情总体趋势总体趋势情感变迁呈现出从真实人际到虚拟陪伴的转变,情感识别与管理逐渐增强,人们在接受技术带来的情感便利时也在警惕其伦理与社会影响,趋向更理性、平衡地期望AI为人类生活提供价值。认知透视与遮蔽:信息依赖认知透视与遮蔽:信息依赖 意识内卷意识内卷工具理性和价值理性之间的冲突。工具理性强调效率、精确度和控制能力,这是AI技术的优势所在。而价值理性关注人的尊严、自由和真实的人际关系,这正是AI技术可能带来威胁的方面。知觉障碍的认知偏差知觉障碍的认知偏差双重透视的虚拟现实双重透视的虚拟现实社交错位的人际关系社交错位的人际关系感官割裂的真实体验感官割裂的真实体

    161、验意愿丧失的自主行为意愿丧失的自主行为需要引入伦理和人文关怀,开发能够反映用户多元价值和需求的个性化AI,设计能够提升人们信息素养和批判思维能力的AI教育,以及建立能够防止AI滥用和保护用户权益的法律和规制等。人类一方面依赖AI在获取信息、理解世界和进行社交等方面具备更强的真实世界洞察能力,但一方面又被AI的信息茧房/美颜的过度美化现象/社交机器人替代人际交往等等带来了更大的遮蔽和困扰。以下是中介矛盾带来人的五大变化:最小版权识别单元:权益冲击最小版权识别单元:权益冲击 法律重塑法律重塑区分区分AIGC内容最小可识别单元,内容最小可识别单元,即识别文字作品或者图像作品相似度,首先将其分割为最小

    162、颗粒度,通过构建评价参数体系,划分视为侵犯著作权的参数范围,从而批量数据化、规范化审核AIGC内容的权益归属。游戏设计师Jason AllenAI作画工具创作的空间歌剧院(Thtre Dopra Spatial)综合对比综合对比融合最小可识别单元细节对比细节对比AIGCAIGC内容是否抄袭内容是否抄袭内容的像素参数化可以帮助识别基色分量的变化,规范甄别过程。世界名画阿尔诺芬尼夫妇像与空间歌剧院同样都运用的大面积暖暗色,并通过框镜扩宽的纵深感,让画面层次丰富,明暗对比。作品细节元素是否抄袭仅靠人眼无法区分。阿尔诺芬尼夫妇像Giovanni Arnolfini and His Wife荷扬凡艾克创

    163、作主体的确定:创作主体的确定:如果AI只是作为工具使用,那么创作主体可能是使用AI工具的人。如果AI在创作过程中使用了预先设定的参数或者指导,那么创作主体可能是设定这些参数或者指导的人。如果AI是完全自主地创作内容,没有人的直接参与,那么创作主体的确定就更为困难。有人认为,应该将AI的开发者视为创作主体;也有些人认为,如果AI的开发者并没有直接参与创作过程,那么他们就不应该被视为创作主体。判别过程:判别过程:AIGC内容如果仅是对在先作品的复制粘贴,人眼无法识别,那么构建最小可识别单元就十分必要。情感细粒度识别理论体系情感细粒度识别理论体系AIAI模拟人类在生日派对模拟人类在生日派对上上的的情

    164、绪变化情绪变化细粒度情感数据地址细粒度情感数据地址:https:/ 虚实交融虚实交融电影人工智能人工智能小男孩渴望妈妈的爱真实的人类中具有自我意识的机器人追求自由效价效价唤醒度唤醒度高唤醒度负性情绪区高唤醒度负性情绪区焦虑、恐慌、愤怒、绝望、崩溃、震惊、鄙夷中高唤醒度负性情绪区中高唤醒度负性情绪区厌恶、沮丧、悲伤、懊恼、烦躁、悲观、恐惧高唤醒度正性情绪区高唤醒度正性情绪区兴奋、激动、欢欣、狂喜、着迷、惊喜、热血中高唤醒度正性情绪区中高唤醒度正性情绪区愉悦、开心、快乐、满意、自豪、乐观、欢快中性唤醒度负性情绪区中性唤醒度负性情绪区低落、失望、郁闷、忧虑、紧张、困惑、无奈低唤醒度负性情绪区低唤醒度

    165、负性情绪区疲倦、孤独、倦怠、冷漠、麻木、消沉、乏味中性唤醒度正性情绪区中性唤醒度正性情绪区和煦、放松、满足、舒适、自信、期待、惬意低唤醒度正性情绪区低唤醒度正性情绪区安心、悠闲、淡定、平静、知足、温馨、恬静AIAI对抑郁症患者文本对抑郁症患者文本的情绪分析的情绪分析通过智能摄像头识别陌生人、车辆,并在出现可疑行为时发出警报,监控住宅小区的安全。监测火灾、煤气泄漏等危险情况。安全监控安全监控:协助家庭实现智能用电,提高能源利用效率。例如,它可以根据居民的生活习惯和实时用电需求,自动调整空调、照明等设备的运行状态。能源管理能源管理:实时监测空气质量、噪音水平等,提醒居民采取相应措施,如戴口罩、关闭

    166、窗户等。协助小区管理者优化绿化、排水等设施,提高生活品质。环境监测与管理环境监测与管理:通过社区平台匹配邻里之间的需求和资源,如共享物品、搭车等。为邻里组织社交活动,促进社区凝聚力。邻里互助邻里互助:监测老人的生活习惯和健康状况,提醒他们按时服药、锻炼身体等。还可以陪伴儿童玩耍、学习,确保他们在家长不在身边时得到关爱和陪伴。老人和儿童关怀老人和儿童关怀:帮助居民处理日常事务。例如,提醒居民关键日期、安排家庭活动、管理家庭财务等。还可以辅助家长教育孩子,提供个性化的学习资源和建议。家庭助手家庭助手:AIAI托管托管:超能中枢超能中枢 贴心管理贴心管理 AI托管服务是指将人工智能、云计算、大数据等

    167、技术相结合,为个人、社区、家庭等提供定制化的、全方位的人工智能服务的一种新兴服务模式。为用户提供更加智能化、高效化、便利化的服务体验。清华大学新闻与传播学院清华大学新闻与传播学院博 士 后博 士 后胡 晓 李胡 晓 李余 梦 珑余 梦 珑张 家 铖张 家 铖张 诗 瑶张 诗 瑶朱 雪 菡朱 雪 菡清华大学临床医学院清华大学临床医学院博 士 后博 士 后安 孟 瑶安 孟 瑶清华大学新闻与传播学院清华大学新闻与传播学院 博 士 生博 士 生陈 禄 梵陈 禄 梵陶炜陶炜章 艾 嫒章 艾 嫒邹 开 元邹 开 元清华大学新闻与传播学院清华大学新闻与传播学院硕 士 生硕 士 生戴维多尔戴维多尔霍 亦 宁霍

    168、 亦 宁刘 思 婷刘 思 婷罗 颖 佳罗 颖 佳许可许可袁 亦 朗袁 亦 朗张荣张荣张 紫 瑜张 紫 瑜郑怡郑怡周 家 萱周 家 萱中央民族大学新闻与传播学院中央民族大学新闻与传播学院助理教授助理教授向 安 玲向 安 玲北京航空航天大学高研院北京航空航天大学高研院助理教授助理教授何静何静北京石油化工学院人文社科学院北京石油化工学院人文社科学院助理教授助理教授尤 可 可尤 可 可同济大学艺术与传媒同济大学艺术与传媒学院学院助理教授助理教授马 绪 峰马 绪 峰伦敦政治经济学院媒体与传播系伦敦政治经济学院媒体与传播系硕 士 生硕 士 生罗 雨 果罗 雨 果复旦大学新闻学院复旦大学新闻学院硕 士 生硕 士 生曾 一 埔曾 一 埔团队科研助理团队科研助理蔡慧蔡慧高 雪 燕高 雪 燕谷倩谷倩葛 秋 霖葛 秋 霖郝 雅 婕郝 雅 婕黄 婧 琦黄 婧 琦刘 东 江刘 东 江邱雨邱雨田野田野王 赢 华王 赢 华赵 建 涛赵 建 涛周琳周琳注:以上排名按姓氏首字母排列,无先后顺序马来西亚博特拉大学马来西亚博特拉大学医学与健康科学学院医学与健康科学学院博 士 生博 士 生李 梦 凡李 梦 凡首都师范大学文学院首都师范大学文学院硕 士 生硕 士 生宋 志 毅宋 志 毅南京大学信息管理南京大学信息管理学院学院博 士 生博 士 生滕婕滕婕注:以上排名按姓氏首字母排列,无先后顺序