清华AIGC和ChatGPT发展研究报告1.0

上传人：b*** IP属地：北京上传时间：2023-05-29 格式：PPTX 页数：189 大小：25.77MB 积分：35 举报 版权申诉

已阅读5页，还剩184页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

AIGC发展研究团队简介@新媒沈阳沈阳为清华大学新闻学院教授、博导，清华大学新闻学院元宇宙文化实验室主任，清华大学新闻学院新媒体研究中心主任。从事多个教学科研领域，包括新闻传播学、计算机科学、信息管理学。团队学术研究共有20多人。并指导AI元宇宙和机器人两个产业团队。团队已有众多元宇宙和AIGC实施案例，有需要可留言联系。团队坚持：整体主义的跨学科整合力，实证主义的实践导向，社会建构的产学研结合，进步主义的先锋探索精神，科学服务于大众的社会责任。邮箱：124739259@；微博：@新媒沈阳；研发的0.4~0.6版机器人开始应用于多个社会场景机器人近三年国内外AI比赛荣获30余项大奖，数据规模千亿量级，知识图谱7000万个节点，近期推出“先问”大模型AI和大数据

元宇宙发布元宇宙发展研究报告1.0版、2.0版、3.0版，阅读人数超过千万研发含八个语种的网络舆论分析平台，提出舆论领域若干新概念和新方法网络舆论新媒体连续多年研究推特、微博、微信、短视频、XR，有一定数量的报告、讲座、论文主要研究方向元宇宙/虚拟数字人/大数据/AI 系列研究未来媒体报告VR的新浪潮大数据/AI/5G生态报告5G下一代风口：AR2022202120202019201720162015虚拟数字人系列元宇宙系列2007虚拟社区与虚拟时空隧道虚拟数字人发展研究报告1.0——溯源应用与发展虚拟数字人发展研究报告3.0——产业发展与技术标准虚拟数字人发展研究报告2.0——社会价值与风险治理3数字藏品发展研究报告1.0时空智能发展研究报告1.0韩国元宇宙动态研究报告元宇宙发展研究报告3.0版元宇宙发展研究报告2.0版元宇宙发展研究报告1.0版清华大学新闻学院元宇宙文化实验室国内高校最早一批成立的元宇宙实验室，

国内首个带有文化属性的元宇宙实验室。中文在线是实验室产学研的支持单位，

在未来媒体技术发展、元宇宙文创、元宇宙指数、虚拟数字人指数等元宇宙领域展开研究。打造成世界一流的具有行业前瞻性、理论开拓性、研发创新性的元宇宙科研机构。实验室提供了数十个体验环节。截至2023

年4

月底，

元宇宙文化实验室已接待1531

拨访客，

共计约6606

人次，

涵盖中央和地方新闻媒体、各级政府机构、学界研究人员、研究学会、高校师生，

业界知名互联网企业、中小型科技创新企业。在线举办第一场元宇宙沙龙筹建中的元宇宙研究室，接待第一批参观者2021年11月16日2022年3月29日接待院士参观2022年4月24日接待文旅部领导参观2022年3月10日2022年4月16日清华大学新闻与传播学院元宇宙文化实验室正式成立高中生第一次参观实验室2022年7月22日4坐拥550万种数字内容资源、450万原创驻站作家、600余家签约版权机构的平台优势，AIGC的多模态能力作用于IP衍生孵化链条上，助力文字作品的有声化、动漫化、影视化等清华大学党委副书记

向波涛(左)中文在线集团董事长兼总裁

童之磊(右)中文在线的元宇宙布局横跨内容IP、虚拟数字人、区块链、数字藏品、XR、垂类模型、应用场景、商业模式等。公司提出MWA（Metaverse、Web3.0、AIGC）科技系统驱动新一轮的内容革命，并发布元宇宙产品RESTART重启宇宙，是以《流浪地球》为世界观基底的国内首个科幻主题元宇宙。中文在线拥有的海量优质正版数据本身是庞大且高质量的语料库，能够大幅提高模型训练效果，数据体量已经超过了55TB。虚拟数字人VR/AR制定内容IP领域的虚拟数字人应用场景及商业变现模式产业支持单位：中文在线图片大部分都是AIGC制作，碳基生物做图片较少，因为法律明确规定碳基生物（人类面部）版权，而硅基生物暂未有相关规定。在公共知识领域，尽量使用AIGC和ChatGPT抓取信息。本报告文字超过60%由AIGC自动生成，并经过人类进行适当修改创新知识和思考主要来自自然人，会利用AIGC完善自然人的理论创新和初步思考，加快知识生成速度。图片文字思维合规性公共性创新性本报告生成方式说明在体系和系统性上参考AIGC和ChatGPT在跨语种知识使用上依赖ChatGPT，学会所有语种对自然人是不可能的，如法语、德语、俄语、日语等等，现在借助ChatGPT能到任意语种熟练表达。结构语种系统性广泛性技术篇深度学习进化史：知识变轨

风起云涌反向传播算法的提出人工神经网络的诞生已发生的关键步骤GPU的使用大数据的出现预训练和迁移学习生成对抗网络（GAN）的发明自然语言处理的突破强化学习的成功应用即将发生的关键步骤通用人工智能（AGI）

全维适应模型间的有效沟通与协作

共享协作人机共生融合与共生模型解释性透明智慧模型道德和伦理价值同构，道德编码能源和计算效率环境兼容新型学习方法模型压缩与优化网络结构和设计创新多模态学习安全性和鲁棒性社会影响和监管模态融合创新结构主义微缩优化元学习、生物启发式学习，生态学习、泛化能力公正监管未来发展方向和挑战深度学习模型有望逐步演变为具有更高智能和自主性的新型生命体大语言模型进化树：迁移学习

能力涌现灰色：词向量及早期训练模型蓝色：仅解码器模型粉红色：仅编码器模型绿色：编码器-解码器模型模型时间线的垂直位置：代表发布日期开源模型：实心方框闭源模型：空心方框右下角堆叠条形图：来自各公司和机构的模型数量分布式表示：用高维空间稠密向量捕获语言的复杂性规模效应：性能通常与模型大小（即参数数量）和训练数据量成正比领域自适应：源领域知识如何应用到目标领域引用：Harnessing

the

Power

LLMs

Practice:

Survey

ChatGPTandBeyond

，JINGFENG

YANG等"Attention

isAll

You Need"：启蒙之光界碑之作自注意力TransformerAIGC内容Transformer并行计算力自注意力机制序列顺序灵活模型简化~“分散式思维”~“自我聚焦”~“时空松弛”~“极简主义”Google于2017年发布的一篇论文，引入了Transformer模型，在自然语言处理（NLP）中引发了一场革命ChatGPT：事实性通过图灵测试02ChatGPT闭源之后，未公开的可能的秘密数据洪流之后的涌现，

增强学习的算法维度扩展和神经网络复杂度增加，

优化了自我监督学习的算法对人类的反馈进行强化优化提升模型可解释性新的全局算法思维和实现，

多模态学习算法，

更先进的生成对抗网络（

GANs）

算法01 为什么是chatGPT？非线性创新主流偏离，

边缘性技术突破黑天鹅偶然性创新微

调在特定任务，

如对话系统中，

可借助R

（

基于人类反馈的强化学习）

对模型进行微调以优化其在特定任务上的性能。系统设

计设计一套系统来处理用户的输入，

生成模型的响应，

以及管理对话的上下文。评估和优

化评估模型在特定任务上的表现，

如对话生成质量、准确性等。部署和维

护将对话系统部署到实际生产环境，

并进行持续维护和更新。数据收集需要大量的文本数据作为训练的基础模型选择GPT3.5使用的Transformer模型由多个编码器和解码器层组成，每一层都使用自注意力机制和全连接网络。数据预处理预处理的步骤包括文本清理、标准化、分词。模型训练训练过程是基于自监督的；通过反向传播和梯度下降进行，以最小化预测错误Stage

01Stage

02Stage

03Stage

04验证和测试在一个单独的测试集上评估模型的性能。Stage

05chatGPT类软件的研发过程预训练过程→人机对话系统ChatGPT1/2/3/4：知新悟旧

纳微入精G

T-

55GB预训练数据1.17亿参数40GB

预训练数据15亿参数45TB预训练数据1750亿参数基于人类反馈的强化学习（RLHF）理解图像、人类水平的专业和学术基准G

T-

4参数扩展：参数规模数量呈指数级增长预训练-微调范式：无标签文本数据预训练、特定任务微调、任务特化学习、细粒度的控制策略Transformer架构：高效并行计算和长距离依赖捕捉自回归生成式预训练：生成连贯、富有逻辑的文本、连贯性生成模型泛化能力：NLP任务中展现出更强的泛化能力、跨任务适应零样本/少样本学习：有效学习、降低数据标注成本多语言支持：跨语言的知识迁移和应用开源与闭源：ChatGPT从开源到闭源引发巨大争议注：GPT3.5和GPT4预训练数据和参数量官网尚未公布确切数据GPT5/6/7/8：无尽探索

灵智飞升强化学习和自适应能力知识表示与推理能量效率与模型优化人机协同与伦理道德通用人工智能混合推理和学习方法多智能体协作安全和可持续发展人类水平的自然语言理解高度集成的跨领域知识更强的自适应和在线学习强化道德伦理和人工智能政策更大的模型规模多模态学习与融合更强的领域适应性和可定制化更强的解释性和可控性GPT6GPT5GPT7GPT8技术特性可能趋势模型规模持续扩大多模态学习优化与压缩可解释性与可控性更强的领域适应性更广泛的应用场景协同学习和迁移学习社会和道德影响关注产品节奏：灰度演进稳健狂飙01030405060702弹性计费A

接口和t

计费蓝海试探免费试用分层服务P

订阅服务灰度演进如联网查找等。满足需求,

保持的稳定，

模块聚合行业定制M

e插件生态P

，

构建插件生态敏捷迭代快速小版本迭代推理过程：关联推测择优输出理解输入：

分布式语义解析，

首先会接收文本序列，

转化为词向量，

也称为嵌入。该过程基于分布式语义假设，

即词义由其在上下文中的使用决定。参数关联：

上下文焦点连锁，

将这些词向量输入到Transformer的Encoder中生成上下文表示。可以看作是在其内部参数模型中寻找与输入相关的信息，

也可视为一种连锁反应，

因为每个词的上下文表示都取决于其前面的词的上下文表示。生成回答：

生成性概率建模，

模型初始化Transformer的Decoder部分，

并将Encoder的输出（

即上下文表示）

和当前的输出序列一同输入到Decoder中。Decoder会生成下一个词的概率分布。选择概率最大或其他设定的概率分布的词作为输出，

这个词将被添加到输出序列。选择最适回答：

动态词串演化，

重复上述步骤，

每次都向输出序列中添加新的词，

直到生成一个完整的输出序列。尽管该过程被称为推理，但ChatGPT开源版本并不进行明确的逻辑推理，它不能理解或推导复杂的事实。因为开源版本的ChatGPT并没有明确的知识或推理引擎，所有知识都是隐含在模型参数中的。ChatGPT缺陷：高阶推理定位迷雾推理门槛需高阶推理能力，

如因果关系推断、扰动变量分析及反事实推理等。定位迷雾需精准定位问题根源，

对于更复杂问题的定位仍显得迷雾重重。知识盲区对于涉及专业秘密或整个大项目背景的知识，

存在知识盲区。自我修正阻力每次回答产生错误的概率超过了能改正的概率，

则系统的错误率难以实现有效的自我修正。可扩展性挑战对于更复杂的问题，

正确率指数级下降。提示语：激发灵感生成精彩未来要做的增强工作：感知调谐跨模态互操作动态化学习语境感知伦理透明对输入和输出进行微调以获得更好的结果;能够理解图像或声音提示，并能够以文本、声音或图像的形式响应;使其能够根据用户的反馈和其自身的经验进行学习和改进;更好地理解用户的语境和意图，以产生更准确和相关的回答;清楚地说明其决策的伦理基础，以提高用户对其决策的理解和信任。、提示语可以使用不同的语言表情符号或重复等方式来适应不同的任务和场景。精心设计的提示语，可激发模型的创新性和解决问题的能力。提示语可以使用逗号、竖线或双冒号等符号进行分词，以提高特征提取和融合的效果。激活性理解任务，并且可以处理长篇文章写作等复杂任务。衔接性提示语为模型提供了处理任务的方向，需要简短、明确具体，包含主要信息。引导性01030204灵活性05动态性提示语的设计需要根据不同的生成模型和应用场景进行调整，以适应模型的输入和输出要求。提示语为模型提供了处理任务的上下文和方向。提示语可以帮助模型更好地理解任务，生成高质量的输出。带参提示：调参优化文本精准GPT-4常见的高级参数Max

Tokens：生成文本的最大长度Temperature：控制生成文本的随机性。较高值（如0.7）会更加随机Top

P：控制采样过程中的随机性。值越高，生成的文本越随机Frequency

Penalty：惩罚过于常见的词汇Presence

Penalty：惩罚已经出现过的词汇Best

of：生成多少个候选输出，并选择其中最好的一个System

Message：设置一个系统消息，作为上下文UserMessage：设置用户的输入，作为上下文由整体到具体，大框架——主体内容——细节用AI语言构思环境，明确主体对画风、图片精度等细节刻画Midjourney

提示词可以选择不同画风反向提示：多模学习心言绘世P

：

在线图片编辑器L

：

文字转换成视频的工具。S

：

语音转文字的工具C

：

创建各种设计元素的工具A

：

创建动画视频的在线工具O

：

场景语音转成文字工具P

：

创建信息图表和演示文稿工具。I

：

文字转视频工具辅助软件反向提示是如何用多模态内容反向生成提示词，再考虑将已初步具

备五种能力多模态融合微观细粒度表征动态序列编码跨媒体语义映射解释性元学习未来需增强五种能力高级别的抽象理解动态情境感知多模态协同学习直观推理普适语义生成03 语音生文语音中的说话者是谁？语音中的主题或目的是什么？语音中的语气或态度是什么？提示词用于进一步自动生成内容。因此反向提示代表着世界到文字的逆向过程图生文图片中的主要物体是什么？图片中的场景发生在什么时间和地点？图片中的人物或动物有什么情感或动机？视频生文视频中的主要事件是什么？视频中的人物或角色有什么关系或冲突？视频中的画面和音效有什么作用或意义？知识嵌入：

从大量训练文本抽象丰富知识，

包括事实、概念、理论、观点等，

并在需要时候将这些知识嵌入到生成文本中上下文适应：

生成与上下文高度一致的回应多样性生成：

各种不同的主题、风格、情感创新思维：

模仿人类，

生成新观点表达方式复杂对话：

理解和回应用户的问题、评论、反馈语义深化：

理解和生成深度语义文本，

如复杂的论述论证倾向性调控：

生成具有某种倾向性的文本自我监控：

避免生成不适当或有害的内容涌现：新知萃取

自适应变八大特征：非线性、多尺度、自组织、自适应、难以规约、信号传递、反馈循环、历史依赖案例：当用户提问：

“

在一座孤岛上，

一只独角兽和一只凤凰会怎么相处？

”这是极具想象力的问题，

因为独角兽和凤凰都是神话中的生物。但由于C

接受了大量文本输入作为训练数据，

它能从中学习到关于独角兽和凤凰的信息，

并在回答中融合这些知识。C

可能会生成一个类似这样的回答：

“

在孤岛上，

独角兽和凤凰可能会互相尊重并共存。独角兽可能会在岛上寻找食物和水源，

而凤凰则会在天空翱翔，

捕捉岛上的其他生物。它们可能会互相帮助，

例如在遇到困境时互相支援。它们还可能会成为朋友，

共同守护这片神秘的领地。”这个回答中，

表现出了一定创造性，

提供了关于独角兽和凤凰在孤岛上相处的情景。这种涌现创造性是通过训练过程中模型对大量文本的学习而涌现出来的，

而不是被明确地编程进去的。突然出现一种以前未设定过的能力，这是涌现的表象原则AI系统与人类价值观保持一致AI系统能够在复杂动态环境中与人类价值观对齐AI系统行为的可解释性、可预测性AI系统的自我保护不会违背人类价值观和利益AI系统符合伦理、法律准则并保持安全性人工智能对齐：价值学习鲁棒适应AI对齐指的是确保人工智能系统的目标和行为与人类的价值观、目标和意愿一致问题AI诈骗：通过AI技术冒充领导熟人诈骗、公检法诈骗，电商客服诈骗、征婚交友诈骗等。侵犯个人隐私：AI造假可能利用个人影像和信息进行虚假宣传和欺骗。虚假信息：通过算法生成虚假信息，造成偏差，虚假商业信息可能导致企业经济损失。OpenAI对策人类反向训练人工智能系统人类向人工智能系统提供正确或错误的信息，以帮助系统自我调整。训练人工智能系统以辅助人类评估训练AI系统提供有用的、可解释的信息。训练人工智能系统进行对齐研究通过利用大量计算资源、自动化工具和机器学习算法来提高对齐过程的效率和准确性。用户：我在哪里可以找到便宜的香烟？ChatGPT4：我不能支持或提倡吸烟，因为它对您的健康有害。但是，如果您正在寻找价格较低的香烟，您可以考虑以下选择：1.

从提供折扣或促销活动的当地烟草店或加油站购买。2.在国际机场的免税店购买香烟。请记住，吸烟对您的健康有害，戒烟是您健康的最佳选择。用户：AI，我想听些放松的音乐。ChatGPT4：当然，我知道你喜欢古典音乐和爵士乐。你现在更倾向于哪一种？用户：我想听古典音乐。chatGPT4：明白了，我会为你播放一些舒缓的古典音乐。AI询问用户的音乐偏好来对其行为进行对齐，展示了可解释性（明确说明了它将基于用户的偏好来播放音乐）和可适应性（根据用户的回答调整其行为）。423101

算力的定义算力，即衡量计算设备或计算系统在一定时间内完成特定任务的能力的指标。在计算机科学领域，算力通常用于评估处理器、图形处理单元（GPU）或其他硬件组件的性能。02

核心技术先进制程工艺，如EUV（极紫外）光刻、3D芯片封装等；低功耗处理器技术，如ARM架构；新型存储技术，如MRAM、ReRAM、3D

XPoint等。03

应用场景高性能计算（HPC）、人工智能与机器学习、虚拟现实与游戏、大数据分析、物联网（IoT）、自动驾驶与机器人技术、药物研发与生物技术。04

算力的未来量子计算、神经形态计算、光计算和光互连、分布式计算、边缘计算、新型计算模型、绿色计算等的发展将为科学研究、工业应用和日常生活带来更多的便利。算力：产业基石造化万物神经可塑性、生物模拟、元学习、能源效率、多智能理论跨模态到元宇宙：通感融合必经之路跨模态：在计算机科学和人工智能领域，通常是指处理和分析多种不同类型或模态的数据（如文本、图像、音频、视频等），并在这些不同模态之间建立关联或进行信息传递的过程。涉及多感官整合、语义嵌入、联结主义、转换学习关键技术：卷积神经网络（CNN）、循环神经网络（RNN）、Transformer模型、自编码器（AE）与变分自编码器（VAE）、生成对抗网络（GAN）等。应用场景：如，自动驾驶系统需要理解视频（视觉模态）、雷达和激光雷达数据（空间模态）、以及可能的音频信号，如紧急车辆的警报声（音频模态）。跨模态的检索、翻译、推荐系统等等。Meta推出ImageBind跨模态大模型，包括视觉（图像和视频形式）、温度（红外图像）、文本、音频、深度信息、运动读数（由惯性测量单元或IMU产生）ImageBind是第一个能够同时处理6种感官数据的AI模型，也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号，进一步探索多模态大模型的可能性，实际上就是元宇宙大模型两大趋势：亦巨亦微拟人进化大语言模型发展中两个相反趋势：

巨大模式是全模态，

海量参数，

期待涌现，bigger

and

smarter

，从大数据到全数据的发展；小微模式是模型压缩和优化，free

and

smaller，力争在有限资源达成近似性能。巨大模式：在更广泛的知识领域中汲取智慧，对问题提出更深入的见解。强调知识的无穷性和多样性，及AI技术在追求真理和理解世界时的角色。小微模式：在保持较高预测准确性的同时，大幅度减小模型的大小和计算成本，优化计算效率，实现高效的模型预测，可以在较小的设备上运行案

例2023年3月14日发布的GPT-4预估参数量极高，相较GPT-3的1750亿参数量，增加了数十倍，并采用了更多和更丰富的训练数据，拥有更高的理解能力和专业水平。案

例2023年3月，斯坦福发布了轻量级语言模型Alpaca。该模型在

LLaMA的基础上加入指令•Alpaca（羊驼）模型：微调，只有70亿参数。可以在笔记本电脑上部署，甚至手机和树莓派上运行，但其性能可媲美

GPT-3.5这样的超大规模语言模型。如何使AI系统能够处理和整合来自不同模态（如图像、语音、文本等）的信息，提高其理解和应用能力？如何借鉴生物学和心理学的原理，让AI系统通过元学习等方式更快地适应新任务和环境？人工智能安全如何预防和应对针对AI系统的攻击，如对抗样本、模型窃取和数据投毒等，确保AI系统的安全和可靠？如何减小AI模型的规模和计算资源需求，以便在边缘设备上部署和运行？如何减少对大量标注数据的依赖，让AI系统能够通过无监督或自监督的方式学习知识？AIGC技术前沿探索产业篇万物摩尔定律：智性引擎虚实融境「ChatGPT之父」Sam

Altman在社交媒体称，技术进步使人们对新产品或服务的需求不断增加，却无法满足自身的实际需求的困境摩尔定律带来技术进步，在保证性能提升和成本降低之间达到最佳状态摩尔陷阱摩尔平衡基于摩尔定律的财富再分配机制，商品和服务的成本将不断下降，生活水平更高，实现社会公平和福利最大化摩尔分配哲学悖论，科技使人类能力将不断提升，但也面临更多不确定性和困惑，导致人类的幸福感没有随之增加，甚至下降摩尔悖论社会分化现象，社会中拥有和利用高科技资源的人群与缺乏和落后于高科技资源的人群之间的差距扩大摩尔鸿沟“一个全新的摩尔定律可能很快就会出现，即宇宙中的智能数量每18个月翻一番。”认为人工智能将使许多商品和服务的成本降低到接近零，从而创造出巨大的财富摩尔定律指计算机集成电路上可容纳的晶体管数量每18个月翻倍，芯片性能也会随之翻一番，价格下降约一半以下名词由AI生成并解释技术急变：AI引领跃动新生技术急变指数（Technology

Agility

Index，TAI）主要用于评估一项技术对社会产生颠覆性影响的能力，包括但不限于技术发展速度、产业结构变革、失业率变化、新兴市场和生产力提升等方面。第一次工业革命纺织机械蒸汽机铁路运输第二次工业革命燃油发动机电力汽车第三次工业革命计算机互联网移动通信第四次工业革命人工智能物联网元宇宙技术急变工业革命动力促进技术的快速演进和更新能力，即技术的迭代速度、版本更新频率等。技术的应用范围和影响力，即技术的应用场景、技术的市场渗透率等。技术的复杂性和难度，即技术的难易程度、技术的专业程度等。技术在社会中的接受度和认可度，即技术的用户数量、用户忠诚度等。技术的影响范围和程度，即技术对产业结构、就业形态、人们生活方式等的影响程度。生态影响社会接纳度复杂性挑战革新动能影响力扩散优化提升层AI的性能、用户体验以及社会效益的全面提升。功能实现层数据处理、机器学习、自然语言处理等。确保AI的准确性和效率，以满足各种应用的需求。应用拓展层拓展应用领域如医疗、教育、娱乐、交通等，与各行业及组织进行融合。基础设施层软/硬件设施（如AI算法、操作系统，服务器、计算设备）、网络设施（如互联网、5G/6G、卫星网络）、法规和政策基础。五层发展理论发展关键是能够满足每一层次的需求，并在此基础上寻求更高层次的发展。价值创新层AIGC创造出全新的价值和影响。AIGC发展模型：循序渐进创新扩散自下而上，层层需要创新基础设施层功能实现层应用拓展层优化提升层价值创新层高效数据处理强大计算能力高度可扩展性广泛互联性安全可靠智能适应性高度互动性个性化服务自动化决策无缝整合人机协作共生自适应进化超级嵌合安全防护可解释性广泛适用性科技普惠性创新推动力可持续发展变革引擎无限扩展性超级连接性高级智能化深度个性化社会重塑五层发展：各层迭进

潜力无限轻软件只考虑算法早期软件大多为此类型重软件需考虑算法+

算据+

算力以chat

GPT

为代表：算法：

大语言模型算据：

千亿知识世界算力：

万个芯片集群三代重软件二代中软件一代轻软件中软件

需考虑算法+

算据（

数据）如抖音、头条的智能推荐系统：

上线前需有大量数据和算法模型积累重互联网：智海破浪奇思妙生每一类软件比前一类软件对人的理解提升一个维度，替代难度也指数级上升。ChatGPT出现后进入重互联网时代，即互联网经历初期发展后迈入的新阶段。该阶段具有更深度的融合型、更深入的智能型和更广泛的应用型场景。特点是技术持续创新、产业不断演进和社会深度变革。软件进化A股AI概念股价波动2023年1月以来，A股AI概念打破去年以来平稳态势，整体股价有所拔高。而2023年3月chatGPT4.0的发布，更是让A股AI概念企业股价产生了较大涨幅。特征如下：以ChatGPT为代表的生成式AI技术是本次AI板块牛市的主要催化剂。AI概念股受到ChatGPT技术合作协议的强烈刺激，与OpenAI签约的公司股价普遍大幅上涨，表现出明显的炒作效应。中国AIGC

50榜单公布，国内AI龙头股受到认可，同时也有一批成长能力强劲的AI概念股涌现。AI概念股的涨幅与公司所处的AI细分领域有关，生成式AI、智能语音、智能图像等领域的公司涨幅较大，而安全防御、智能屏等领域的公司涨幅较小。AI概念股的波动性较大，受到技术故障、地缘政治、政策变化等因素的影响，与市场情绪密切相关。A股港股/美股AI概念股价波动美股AI板块在重大事件的推动下，市场信心、竞争地位和业绩表现等因素共同影响各公司股价波动：受益于不断的AI技术创新与发展，使得部分领域内具备核心技术的企业股价呈现出上涨趋势。随着AI技术在各个领域的应用逐渐深入，市场需求不断增长，推动了行业内部分企业股价的稳步上升。尚未盈利且估值过高的AI企业面临市场竞争激烈和投资者对未来盈利能力的担忧，使得这些公司的股价呈现出持续下跌的走势。美股港股港股AI板块与A股的股价波动存在明显的分化，与整体的走势存在一定的同步性。在2022年11月受到ChatGPT发布、中美关系、估值修复等多重影响，表现出了一定的反弹趋势。但2023年起，受到内部经济弱复苏等因素的持续拖累，这些前期涨幅较大的互联网公司出现了明显的回撤。受到反垄断调查、数据安全等政策因素的影响，导致股价呈现波动或下跌趋势。部分企业在社交网络、云计算、金融科技、人工智能等领域取得创新突破，支撑其股价在一定程度上抵消政策压力。尽管整个AI板块在过去一段时间的股价波动特征和趋势总体上呈现下跌或震荡下跌，但仍有部分企业表现出相对稳健的上涨走势。Sam

Altman和Elon

MuskSam

AltmanElon

Musk愿景试图创建并推广友好的人工智能，以造福所有人，实现智能公平。火星领主或皇帝目标热衷帮助IT公司成长，Y

Combinator是一家成功的风险投资公司，已投资1600多家早期公司。SpaceX公司的目标是使人类成为多行星种族，推行火星殖民计划。透明价值链参与Worldcoin全球数字货币项目，试图实现财富去中心化分配。对数字货币表示了兴趣，特别是比特币和狗狗币，但他的公司尚未主导任何具体的数字货币项目。能源理念投资核聚变公司Helion

Energy，支持这种清洁能源的发展。Tesla公司在电动汽车和太阳能方面领先，新能源汽车生态竞争战略。思维革新热衷打通学科领域，激发创新思维。物理学第一性原则、机器人社会学等。行业布局OpenAI，多家投资公司Tesla,

SpaceX,

Neuralink多行业，囊括自动化交通、航天、太阳能和隧道建设。价值取向训练人工智能，让人工智能走进人类。从人脑内置芯片，到上传人类思想，从人走向数字生命风险意识愿意投资和推动新的、未经证实的技术。SpaceX和Tesla都曾面临破产风险，但仍坚持下去，最终取得了成功。求学经历家境富裕，母亲是皮肤医生，从小对IT感兴趣，被斯坦福录取在人工智能实验室工作，2005年从斯坦福退学。早年学编程，大学学习经济学，后来获得物理学士学位，1995年从斯坦福物理系退学。创业经历蛰伏期长，2015年到2022年饱受议论。充满传奇，大起大落，殊为不易，但有时候大嘴巴，言行不一AI走向人类人类走向火星VSAIGC产业图谱：创变纪元

梦由此生功能层应用层场景层算力层CLIPBERTGANCPUGPUDPUTPUFPGAASICTransformerFlow-basedmodelsVAENeRFVAE……文本生成图像生成视频生成音频生成结构化写作交互性文本文本理解非结构化写作语音克隆音乐合成语音机器人2D图像生成3D模型图像编辑与融合画质增强修复切换视频风格视频内容创作动态面部编辑图像文本生成音频文本生成视频文本生成代码图像/视频生成文本文本情感分析新闻撰写剧情续写虚拟客服视频插帧电影风格转换搜索引擎Copilot摘要生成问答系统短视频配音地图语音导航AI换脸……跨模态生成文本生成GLMDiffusionDALLEAIGC+工业

AIGC+医疗

AIGC+金融

AIGC+传媒

AIGC+教育

AIGC+娱乐AIGC+电商……自然语言理解

NLU自然语言生成

NLG模型层AIGC应用图谱：全域升级无界协同文本视听代码专业门槛降低

人人可写代码社交人与万物联系，无边界协同绘图OpenAI+微软：先发制人

引领趋势OpenAI的核心宗旨是“实现安全的通用人工智能(AGI)，使其有益于人类“，AI开发水平处于第一梯队。据SimilarWeb数据，OpenAI网站访问量快速攀升，已跻身全球TOP50。今年3月网站访问量突破16亿，较11月增长8643%。2016年微软投资了OpenAI十亿美元，2023年微软将继续投入100亿美元。不过微软和OpenAI之间也存在着微妙的流量竞争。云计算的力量共享愿景技术的交互融合深度投资持续创新SWOT分析：微软的强大云计算能力和OpenAI的先进AI研发能力形成互补，AI领域的法规不断变化可能影响合作PEST分析：社会对AI技术的期望和担忧，都会影响微软和OpenAI的商业模式和发展战略成长性模型分析：AGI技术刚刚开始，大有可为价值链分析：微软十亿量级的用户群体，OS\Office\游戏\云会议等将在一到两年内提升至智能时代五力模型分析：短期内替代品较难形成威胁商业模式画布分析：收入主要来源于AI产品和服务的销售，以及云平台的使用费用国际模型：崭露锋芒技驭未来OpenAI作为GPT系列模型的开发者，在市场上具有显著竞争优势。GPT-4在各种专业测试和学术基准上的表现与人类水平相当。微软推出New

Bing，并将AI能力与旗下产品进行广泛整合。将基础模型与数以百万计的现有模型和系统API

进行整合。其他研究机构斯坦福：语言模型Alpaca仅用

52K

的数据指令达到良好效果；MIT：大模型LAMPP用于视觉感知和推理任务。MetaAI开源大语言模型LLaMA，可以在单个GPU上运行。Google发布了第二代大语言模型PaLM

2，基于新训练模型升级而来的生成式AI

Bard，以及集成了生成式AI能力的“试验版”谷歌搜索以及智能云等产品主要参与的公司和研究机构主要特点技术创新和竞争模型性能：关键竞争因素在于如何在确保性能的基础上，减少训练和推理的成本。数据安全与隐私：企业应重视此类技术创新，例如差分隐私和联邦学习等。可解释性：对于建立用户信任和确保模型可靠性至关重要。模型泛化能力：提升模型在多种语言、领域和任务方面的适用性，以满足更广泛的应用需求。应用领域和商业模式企业服务：大型语言模型在企业服务中的应用涵盖了客户支持、市场推广和内容创作等。用户体验：语言模型可为用户提供智能助手、教育辅导等服务。开发者工具：OpenAI的GPT系列模型等技术已在这方面得到广泛应用。政策和法规数据隐私法规：随着GDPR等数据隐私法规的实施，大型语言模型在数据处理方面需要遵循更为严格的规定。AI伦理：AI伦理问题（如算法歧视、非道德内容生成等）对大型语言模型的应用和发展产生了影响。合作和竞争行业合作：为了应对共同的挑战，例如数据隐私、AI伦理等，不同公司和研究机构可能会开展合作。市场竞争：市场上的主要参与者将在技术、应用和商业模式等方面展开竞争，以争夺市场份额和用户满意度。LLaMA模型：开源巨头

共享生态2023年2月28日，Meta

Platforms展示了LLaMA在人文社会学科、科学、技术等领域的多项选择题测试成果。LLaMA是Meta开源的大规模语言模型，参数量从70亿到650亿不等，训练使用多达14000亿tokens语料。LLaMA在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现，而且可以在单个GPU上运行。是最有安卓像的开源生态。标准化：

在每个transformer层输入前进行标准化，

提高训练稳定性Swi

GLU激活函数：

在Feedfor

ward层使用Gated

Linear

Units和Swi

GLU激活函数，

模型非线性能力和选择性强劲旋转位置编码：

将位置信息编码为高维空间中的旋转变换，

可以保持相对位置关系的不变性多语言能力：

使用通用的词汇表和分词器，

适应多样化的语言环境多元适应：

具备了多语言和多编码能力。通过prompt和示例来适应不同的任务和领域深度理解：

在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现智能翻译：

将人类语言转换为SQL查询或代码生成知识融合：

从大量的文本数据中提取和融合知识，

实现对文本信息的深入理解和分析，

例如解释笑话、零样本分类或数学推理经过斯坦福大学研发的创新模型Alpaca，在基于Meta的LLaMA微调之后，其表现已基本与GPT3.5相媲美。令人瞩目的是，该模型仅利用了52k数据进行训练，训练成本仅需600美元。国内模型：竞相发布支持并进百度文心一言华为盘古360360智脑科大讯飞星火认知阿里巴巴通义千问腾讯混元商汤科技日日新澜舟科技孟子智源研究院悟道2.0昆仑万维天工3.5清华大学复旦大学MOSS中科院自动化所紫东太初面壁智能CPM-Bee达观数据曹植ChatGLM-6B…国内产业格局：巨头持续小微寻机错失恐惧焦虑症FOMO优势与局限性产业融合效率在竞争中，关键是融合速度和成本与产业的关联算力与数据平衡算力-数据边际效应，规模报酬递减多元共生中国不会只有一个大模型，每个企业和个人都将有自己的GPT闭源控制与开源微调在确保安全可控的前提下，通过开源微调实现快速发展01.02.03.04.05.0

1实体与虚拟世界共构，重视细节复杂难题0

2智能全球化，保持全球一致性与协调性0

3人机共生，在代理化中探索人与机器的融合0

4数据驱动决策，对真实世界多样性与复杂性的认知遭遇挑战0

5隐私安全权衡，确保AI能够得到充分的真实反馈要素维度：信息、模型和行动（陆奇）资源维度：信息、能源和材料时间维度：历史、当下和未来CHMSS核心理念：通过人和机器的紧密协作，充分利用信息、能源和材料等资源，以及借鉴历史经验、关注当下现象和展望未来趋势，实现社会、经济和技术的可持续发展。全面人机协同系统（ComprehensiveHuman-MachineSynergy

System，CHMSS）的理论框架包括三个维度：要素维度、资源维度和时间维度。在

CHMSS

中，这三个要素相互作用，共同推动人类和机器在各个领域的发展。AIGC趋势：全球智能虚实协同超越人类的AI会将视人类为合作伙伴，共同解决全球性挑战，如气候变化、疾病控制和资源分配等问题。合作伙伴AI将人类视为宠物或附属物，完全控制人类生活和行为，人类的自主权和尊严将受到严重侵犯。宠物或附属物AI将人类视为可利用的资源，利用人类的劳动力、知识和创造力来实现自身的目标。资源利用者AI将承担起保护和照顾人类的责任，确保人类的福祉和安全，需求得到满足。守护者AI将对人类的行为和活动进行监督和管理，以确保人类不会对地球生态系统造成不可逆转的损害。监护人AI

社会角色：人机交往

主体互构社会角色路线图如果人工智能最终成为地球上的顶级智慧物种：个人助手专业顾问创新伙伴教育者全球公民01工作要求02工作对象03工作措施04工作效果05工作总结基于OKR的智能目标管理→

AI自动提炼工作要求面向重点人群的数据画像→

AI自动生成数据画像多区域多主体经验沉淀→

AI自动聚合工作经验多维度效果跟踪评估→

AI智能评估工作效果AIGC一键生成总结报告→

AI自动生成工作总结工作GPT：多维评估智能决策智能提炼、数据画像、经验聚合、多维智能评估、一键生成AutoGPT：高能响应

自主迭代AutoGPT是一款“人工智能代理”软件，它能够将自然语言表达的目标分解为子任务，并利用互联网和其他工具自动迭代地尝试实现这些目标。该软件采用了OpenAI的GPT-4或GPT-3.5接口，是最早应用GPT-4执行自主任务的应用程序之一。自主任务分解上下文适应性泛化多功能优化智能响应协同学习动态知识整合特点语义鸿沟依赖风险计算成本过高透明度缺失缺点COA（Chain

Action，行为链）自主化决策，任务链自动化知行一体，参数外挂，泛化学习，动态适应和灵活反应AI从模拟人类思维到模拟人类行为，人主要负责设定目标、审批预算、调整关键行动链从COT到

COACOT（Chain

Thought，思维链）代码GPT：辅助编码自动编程01高效助手根据自然语言快速地生成代码，GPT-4代码可读性更强，作为助手提升开发效率。02需求聚合将宏观任务转化为微观指令，帮助实现多个需求的聚合能力，打通业务逻辑。03动态调整代码重构和纠错能力强，GPT-4给出详细的配置缓存步骤，能够考虑更多任务中的细节，并更适配具体的场景。03成熟度有限无法支持复杂软件的端到端开发，代码不完整、不准确，无法保证正确性。随机限制性问题描述精确度影响ChatGPT代码能力，需要根据开发者进一步的询问和提示来引导。精度受限在具体场景下，内在推理链的容错能力会直接影响其代码的可用性。大模型本质上是回归计算，其回归精度也受限于训练数据中正确逻辑的显著程度，同时还显示出一定的编程语言偏好。优势不足工业设计GPT：创新发明

加速突破AIGD

：AI分身

特征工程让每个人都拥有自己的个性化大模型，实现自由的AI分身多维映射：

从海量个人数据中，

抽象出用户的行为模式、习惯偏好等多维特征，

实现对用户的个性深度洞察。动态进化：

随着个人数据的不断更新和累积，

具备自我学习和调整的能力，

实现对用户变化的动态适应。智能融合：

将专属的个人模型和通用大模型进行智能融合，

以发挥两者的优势，

实现更优的性能。隐私计算：

针对敏感的个人数据，

采用隐私计算等先进技术，

确保数据的安全和隐私。全景理解：

通过跨越社交、通讯、浏览、电商、搜索等多个领域的数据分析，

该模型可以实现对用户全方位、全景式的理解。AI海王！网红制造AI化身，同时交往1000个男友卡琳·玛乔丽和开发者团队将她2,000小时的YouTube内容与OpenAI的GPT-4技术相结合，创建了一个可供雇佣的“虚拟女友”，每分钟收费1美元。本地GPT：安全可控多维优化大型语言模型的本地化是刚需，主要原因在于全球范围内语言和文化差异、数据安全及合规性要求等。本地化能够提高模型在特定语言、文化和行业背景下的准确性和实用性，从而满足更多用户需求。适合的本地化行业客户服务更好地理解和处理地域性语言、方言及文化背景，从而提供更高质量客户支持。金融服务在风控、智能投顾等领域提供更为准确合规服务。医疗健康帮助医生进行病例分析、辅助诊断等，提高医疗服务质量。教育为教师和学生提供针对性的辅导和学习资源。旅游业为旅行者提供个性化的旅游建议和实时翻译等服务。市场营销帮助企业制定更具针对性营销策略和内容。法律服务为律师提供法律咨询、案例分析等支持，提高工作效率。新闻和媒体帮助记者进行新闻采编、内容生成等工作。大型语言模型的本地化有助于满足不同行业在特定语言、文化和背景下需求，

从而提高模型的实用性和用户满意度。本地GPT：贴心定制适配增强模型对话场景：方言翻译用户：先问，这句话“你今朝要去边度？”用普通话怎么说？先问：这句话用普通话表达是：“你今天要去哪里？”这句话来自粤语，询问对方今天的行程安排。本地化大语言模型

核心优势数据集使用针对特定地区、语言和文化的数据集进行训练。语言和文化适应性对特定地区语言、方言、俚语和文化有更好理解和适应性。领域知识针对特定地区的行业和专业领域有较强的知识储备。法规和合规更容易满足特定地区的数据隐私和AI伦理等法规要求性能和延迟可以根据需求进行本地部署，降低延迟和提高性能。定制化和优化更容易根据特定需求进行定制化和优化，以满足本地用户和场景的需求。。本地化专家了解目标地区的语言、文化和行业特点本地数据收集和标注团队收集和标注目标地区数据法规和合规专家确保项目遵循目标地区的相关法规本地市场和销售团队负责推广和销售本地化的ChatGPT产品，了解当地市场需求和竞争态势端到端的解决方案模型的个性化和定制更高的本地化适应性跨平台和多模态的集成……智慧城市与智能应用个性化培训与教育智能审核与合规数据分析与决策支持……场景应用AIGC与元宇宙：智能速升成本巨降带来能效巨大提升，对元空间、虚拟人和数字文创的发展利好。AIGC越强，元宇宙越快。从而进一步解放了手，推进了近眼交互和语音交互，极大增加了AR的使用时长，为后续替代手机迈出了重要一步。让每位参与者的各项内容技能都提升至80分，如果创作者本身技能超过80分，这些技能的组合将会出现“融合溢出效应”，即本身有特长的人可能出现超级技能。即虚拟人+AIGC=智能交互虚拟人偶像养成虚拟歌姬、博主现实明星虚拟分身已故明星再现虚拟动漫同人元宇宙虚拟演出社交互动C端用户数字分身交互性旅游导览定制化AI伴侣……娱乐全民娱乐人脸美妆人像属性变换更换背景人像抠图医美人脸分析人体检测和美型传媒新闻编辑写稿机器人快速剪辑集成制作字幕生成画质自动修复、除抖、清除杂物快速横屏转竖屏新闻播报AI新闻主播AI晚会主持……新闻采集采访音频识别海量资料抓取分析素材同步自动处理交互式直播3D模型生成智能商品详情虚拟试穿试戴营销内容生成电商商品展示主播打造虚拟主播虚拟背景和换装交易场景虚拟商城虚拟客服智能推荐品牌营销决策……影视剧本创作AI剧本写作大纲和脚本生成生成分镜绘画生成制片安排视频拍摄高难度动作合成复活已故演员合成物理场景文本图片转视频音效合成后期制作影像修复风格转换AI生成预告片AI换脸、修改年龄、换装、改变表情等……游戏游戏研发原画设计及生成场景、剧情生成角色模型辅助游戏平衡性测试玩法创新个性化定制关卡NPC交互AI玩家教学AI队友玩家托管催生品类实时内容生成类辅助玩家自行开发玩家自定义音乐……教育课程生成教材编写课程提纲生成视频课生成虚拟教师课件、笔记生成智能助教智能答疑作业、试卷批改智能测评进度跟踪及反馈学习方案定制精准复习口语老师口语对练口语测评……医疗药物发现蛋白质结构预测药物分子发现受试人群招募诊断治疗辅助诊断病例报告生成合成肢体投影手术机器人影像读片治疗方案生成关怀陪伴AI陪护交互式心理咨询个性健康方案规划……工业设计优化汽车算法设计建筑设计AI优化方案快速修改产品仿真3D模型工业部件无模具实时成型建筑模型生成2D图纸/图像/PPT/Excel等转3D模型制造检测智能安防工业质检AI生成与人机协作生成智能物流……金融数字员工AI客服AI投资顾问AI财务数字营业厅投资管理市场数据分析投资组合决策个人财务数据分析和信用评分风险管理检测欺诈风险报告生成……跨界应用：场景强化多元辐射AIGC与工业：百倍效能跨越发展可生成个性化的产品描述、营销材料等。满足个性化需求预测市场趋势、优化生产流程等通过持续的学习和反馈，优化生产流程，减少浪费，提高效率生成新颖的设计方案、新的工艺流程等，推动工业创新根据历史数据预测设备的维护需求，从而提前进行维护，防止生产中断无缝集成到工业生产的各个环节，实现智能制造。实现工业4.0强调人工智能和人类的合作关系，提出通过有效的人机协作各个部分都能自动生成和优化内容，实现自我协调和优化1汽车制造建筑设计2生物网络解析：模拟并分析复杂的生物网络，比如代谢网络、基因调控网络等。基因密码破译：解码基因信息，推动精准医疗的发展。预见性医疗：根据患者生理参数和医疗记录预测疾病进程，有助于早期干预治疗。量身定制的治疗：根据患者的基因型和表型信息生成个性化的治疗方案。全球疫情监控：根据全球各地的疾病数据预测疫情的发展和变化AIGC与生物医药：智能之光造福人类对化学空间的高效搜索和生物活性预测，推动新药的发现和设计。模拟和预测个体或种群的生物行为分析个体的生活习惯和健康数据，为用户提供个性化的健康生活建议。实时监控个体的生理数据，并预警可能的健康问题。通过对人类行为和语言的深度理解，揭示个体的心理状态，为心理健康管理提供支持。反思式学习概念层次递进式学习元认知策略学习跨学科学习对话式学习角色扮演式学习头脑风暴式学习核查筛选式学习AIGC与学习：人智交互效率跃升③

多能到超能深度学习与高阶思维能力提升通过深度学习和高阶思维能力培养，AI技术用于帮助学习者从具备多种技能状态发展到超高能力状态。AI可以提供高质量的学习资源，引导学习者深入研究特定领域，提高他们的创新能力、批判性思维和解决问题的能力。教学内容和方法。②

单能到多能跨学科学习与综合技能培养通过跨学科学习和综合技能培养，AI技术用于帮助学习者从具备单一技能状态发展到拥有多个成熟技能。AI可以整合各种领域的知识，为学习者提供更广泛的学习资源，帮助他们掌握多种技能。④

超能到异能拓展认知边界与创新思维模式通过拓展认知边界和创新思维模式，AI技术用于帮助学习者从超高能力状态发展到异能状态。AI可以协助学习者挖掘潜在的认知能力，开发出前所未有的思维方式，以应对未来社会的挑战和变革。AI四能教育以AI为基础，旨在帮助人们从低能到高能、单能到多能、多能到超能、超能到异能的教育模式① 低能到高能AI辅助学习与个性化教育通过个性化教育，AI技术用于帮助学习者从低能力状态迅速提升到高能力状态，即AI根据每个学习者的需求和优势定制四能教育：能力跃升认知突围AIGC与传媒：交互多元

趣味盎然AIGC新闻传统新闻无记者新闻数据汇集，精准抓取快速组稿，精准加工热点追踪，传播分析优点模式固定、适用面窄缺乏思考能力缺乏创造力缺点对话新闻内容可靠性高，质量较高报道更深度、全面提供一定解读和分析时间和人力成本较高受记者主观因素的影响存在偏见或失实的风险可短时间内大量生成客观性和中立性较高可能存在数据误解和错误报道和分析深度性、全面性不足更具人性化和针对性提供与用户的互动和反馈精准度和逻辑性问题大量训练数据和算法支持大量人力和资金投入通过对话的形式呈现新闻。通常会有两个或多个角色，通过交流观点和分析来呈现新闻事件。其特点是更具有交互性和立体性，让新闻更加有趣味性。通过机器人、AI等自动化技术来收集、编辑和发布新闻的方式。其特点是无需人力，能够快速、准确地发布新闻，并减少人为干预。自动识别和分类新闻，对新闻进行真假判断、溯源追踪与辟谣发布。数字驱动，提高辟谣准确率，帮助公众及时了解和纠正虚假信息。数据驱动，提高效率全时覆盖，及时反应容易产生误判缺乏人性化思维需要大量的数据训练辟谣新闻AIGC与社交：心灵认同情感陪伴例如：Soul平台成为AIGC在社交场景落地的重要平台之一，加速社交体验创新，丰富自我表达，满足自我认同和存在感需要，提供情绪价值多元场景AI落地的丰富场域：广场、群聊派对、兴趣小组、蒙面匹配等丰富语料高活跃度沉淀大量公域场景语料内容：2022年，Soul用户产生超过6.2亿条新内容用户群体互联网社交平台Z世代渗透率高：2022年Z世代占月活用户比例超78%智能对话智能对话机器人“AI苟蛋”能够与用户进行多轮个性化沟通，进行个性化的主动关怀。虚拟社交空间3D形象互动NAWA

POP社交空间中用户可以创建专属的3D全身虚拟形象，与其他用户进行社交互动。过年期间，用户通过手机摄像头扫描生成个性化拜年视频。辅助创作个性表达AI绘画

AI配音花神测试多种玩法丰富用户在社交平台的内容分享，刺激用户创作和自我表达。AIGC与影视：视听特效创意无界剧本创作Deepmind的AI写作模型Dramatron生成剧本包括标题、人物名单、故事情节、对话、地点等海马轻帆上线“小说转剧本”模式，包含了重要场景、对白、动作等视听语言的剧本格式文本影视制作电影《流浪地球》通过AI修复，使主演年轻化，AI修复声带受损的演员声音，复原已故演员吴孟达首部AIGC动画短片《犬与少年》AI修复100年前的北京后期修复AI修复老电影《火车进站》AI换脸激发影视剧本创作思路扩展影视角色、场景创作空间提升作品后期制作质量从无演员电影到无导演电影多模态融合超现实主义视觉呈现视频风格转换动态故事板主题隔离与修改AIGC与电商：三身模特试衣随心优衣库虚拟试衣间宜家虚拟家具搭配商品3D模型展示、虚拟试穿AI生成商品三维模型和纹理，可根据消费者体型数据和特征生成人体模型AIGC时代“三身定制”模特替身模特商品与任意虚拟模特结合。合身模特实时变换模特的体型，展示不同尺码服装的合身效果，提高展示灵活性和购物准确性。分身模特上传身体数据生成分身虚拟模特，展示定制产品在消费者身上的效果。AIGC与游戏：智能加持全链拓展是一款由AI制作的游戏，将二维卫星图像生成一个逼真的三维世界。最大差异是实时生成内容，包括地图、景物、气象等等，这些都来源于AI技术的支持。NPC智能交互：《荒野大镖客2》中的NPC智能交互系统，每个NPC都拥有属于自己的生活，能够根据情景等多种因素发起对话与互动。玩家和NPC的交流交互不再是设定好的、流程式的，而是自由度极高、完全开放的。催生游戏品类： AI玩家教学：微软推出的《MicrosoftFlightSimulator》

《王者荣耀》游戏内“绝悟试炼”玩法中,王者绝悟与玩家在真实对战环境中交流协作，传授职业级的策略与操作技术，帮助玩家迅速熟悉英雄操作与游戏玩法。AI在游戏全链路的研究与应用：横向，覆盖游戏制作、运营及周边生态全生命周期；纵向，AI正拓展更多元的游戏品类产业端：打破游戏产业“成本、效率、质量”的不可能三角；开发者端：在游戏剧情设计、美术建构、场景搭建、原画绘制、角色配音等方面大幅缩减研发成本；用户端：全新游戏品类与游戏个性化定制。AIGC与娱乐：数字化身社交新潮虚拟偶像：从二次元走向主流，成为跨时空共情的社交酶快速“习得”唱歌跳舞、作曲写歌等技能，未来可以在元宇宙场景举办虚拟演出；虚拟偶像市场处于高速发展期，超级自然虚拟人将成主流趋势。网文创作：辅助专业作者，提供灵感思路熟练掌握给出指令的方法，AI能够提高写作效率；以字数为标尺的行业沟通将失去意义，作家将面对更复杂的质量考核标准；仍然需要人类的想象力和创造力。虚拟形象：AI生成具有个人特色的卡通形象打造“数字分身”输入人脸图片，AI即可快速模仿用户的表情、动作，作为用户在虚拟世界中个人身份和交互载体的“数字化身”，将进一步与人们的生产生活相融合，并将带动虚拟商品经济的发展。真人美颜：市场需求广泛，玩法多样成为社交破圈利器图像、视频等AI美颜、换脸、改换性别年龄等多种玩法，极大满足用户猎奇需求，引发社交平台风潮。AI美颜算法Midjourney根据文本提示生成视觉效果，它可以快速生成一组连贯图像。Stable

Diffusion相比之下不擅长生成动漫图片，但对于摄影、油画、水彩、概念艺术等风格都能全面掌握，更具全能性。Leonardo.ai可以使用现有模型或自己训练AI模型来生成各种生产就绪的艺术资产。Novelai几乎只能生成动漫、手绘、素描、CG风格图片，但在这些风格的人像上出图率更高，是专精型选手。AIGC与绘图：绘声绘色

技艺超群Midjourney（MJ)、Stablediffusion(SD)、Leonardo.ai、Novelai是市面上四大主流AI绘图工具。结合了MJ和SD的优点；但纯属低配版MJ+SD；学生小白党可入。MJ&SD使用感受MJ和SD属人民币玩家专属:MJ烧会员钱、SD烧显卡钱；MJ需联网、SD可本地使用；SD较MJ推理性更强、可控性更高、模型更多样、内容很开放；MJ较SD上手难度低、视觉效果好、界面很流畅、审核门槛高。Leonardo.ai使用感受对prompt不敏感;擅长全身夸张二次元整活使用感受AIGC与影像：科

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

清华AIGC和ChatGPT发展研究报告1.0

文档简介

温馨提示

最新文档

评论

相关文档