2024AIGC技术进展研究报告

上传人：1*** IP属地：湖南上传时间：2024-04-25 格式：DOCX 页数：186 大小：30.04MB 积分：24 举报 版权申诉

已阅读5页，还剩181页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

AIGC发展研究进展2024元宇宙/虚拟数字人/大数据/AI 系列研究虚拟数字人发展研究报告3.0虚拟数字人系列——产业发展与技术标准虚拟数字人系列虚拟数字人发展研究报告2.0——社会价值与风险治理虚拟数字人发展研究报告1.0——溯源应用与发展大数据/AI/5G生态报告未来媒体报告

2022202120202019201720162015

数字藏品发展研究报告时空智能发展研究报告元宇宙系列韩国元宇宙动态研究报告元宇宙系列元宇宙发展研究报告3.0版宇宙发展研究报告2.0版元宇宙发展研究报告1.0版5G下一代风口：ARVR的新浪潮2007 虚拟社区与虚拟时空隧道3合规性本报告生成方式说明合规性图片大部分都是AIGC制作，碳基生物做图片较少，因为法律明确规定碳基生物（人类面部）版权，而硅基生物暂未有相关规定。图片图片大部分都是AIGC制作，碳基生物做图片较少，因为法律明确规定碳基生物（人类面部）版权，而硅基生物暂未有相关规定。公共性在公共知识领域，尽量使用AIGC和ChatGPT抓取信息。本报告文字超过60%由AIGC自动生成，并经过人类进行适当修改文字公共性在公共知识领域，尽量使用AIGC和ChatGPT抓取信息。本报告文字超过60%由AIGC自动生成，并经过人类进行适当修改创新知识和思考主要来自自然人，会利用AIGC完善自然人的理论创新和初步思考，加快知识生成速度。思维创新性创新知识和思考主要来自自然人，会利用AIGC完善自然人的理论创新和初步思考，加快知识生成速度。在体系和系统性上参考AIGC和ChatGPT结构系统性在体系和系统性上参考AIGC和ChatGPT在跨语种知识使用上依赖ChatGPT，学会所有语种对自然人是不可能的，如法语、德语、俄语、日语等等，现在借助ChatGPT能到任意语种熟练表达。语种广泛性在跨语种知识使用上依赖ChatGPT，学会所有语种对自然人是不可能的，如法语、德语、俄语、日语等等，现在借助ChatGPT能到任意语种熟练表达。技术篇深度学习进化史：知识变轨风起云涌深度学习进化史：知识变轨风起云涌已发生的关键步骤人工神经网络的诞生反向传播算法的提出GPU的使用大数据的出现预训练和迁移学习

即将发生的关键步骤通用人工智能（AGI）全维适应模型间的有效沟通与协作共享协人机共生融合与共生模型解释性透明智慧模型道德和伦理价值同构，道德编码能源和计算效率环境兼容生成对抗网络（GAN）的发明强化学习的成功应用

未来发展方向和挑战新型学习方法模型压缩与优化网络结构和设计创新多模态学习安全性和鲁棒性社会影响和监管自然语言处理的突破

元学习、生物启发泛化能力

微缩优化

创新结构主义

模态融合

公正监管深度学习模型有望逐步演变为具有更高智能和自主性的新型生命体大语言模型进化树：迁移学习能力涌现大语言模型进化树：迁移学习能力涌现灰色：词向量及早期训练模型蓝色：仅解码器模型粉红色：仅编码器模型绿色：编码器-解码器模型开源模型：实心方框右下角堆叠条形图：来自各公司和机构的模型数量分布式表示：用高维空间稠密向量捕获语言的复杂性规模效应：性能通常与模型大小（即参数数量）和训练数据量成正比领域自适应：源领域知识如何应用到目标领域引用：HarnessingthePowerofLLMsinPractice:ASurveyonChatGPTandBeyond，JINGFENGYANG等"Attention is"Attention isAllNeed"：启蒙之光界碑之作Transformer并行计算力AIGC模型简化AIGC

~“分散式思维”自注意力自注意力内容Google于2017年发布的一篇论文，引入了Transformer模型，在自然语言处理（NLP）中引发了一场革命内容ChatGPT：事实性通过图灵测试为什么是chatGPT？非线性创新主流偏离，边缘性技术突破黑天鹅偶然性创新ChatGPT闭源之后，未公开的可能的秘密数据洪流之后的涌现，增强学习的算法维度扩展和神经网络复杂度增加，优化了自我监督学习的算法对人类的反馈进行强化优化提升模型可解释性新的全局算法思维和实现，多模态学习算法，更先进的生成对抗网络（GANs）chatGPT类软件的研发过程Stage01Stage02Stage03Stage01Stage02Stage03Stage04Stage05数据收集需要大量的文本数据作为训练的基础

微调在特定任务，如对话系统中，可借助RLHF（基于人类反馈的强化学习）对模型进行微调以优化其在特定任务上的性能。数据预处理预处理的步骤包括文本清理、标准化、分词。模型训练训练过程是基于自监督的；通过反向传播和梯度下降进行，以最小化预测错误

模型选择GPT3.5使用的Transformer模型由多个编码器和解码器层组成，每一层都使用自注意力机制和全连接网络。验证和测试在一个单独的测试集上评估模型的性能。

系统设计设计一套系统来处理用户的输入，生成模型的响应，以及管理对话的上下文。评估和优化评估模型在特定任务上的表现，如对话生成质量、准确性等。部署和维护将对话系统部署到实际生产环境，并进行持续维护和更新。知新悟旧纳微入精5GB1.17亿参数G5GB1.17亿参数GPT-140GB预训练数据15亿参数GPT-245TB1750亿参数GPT-3基于人类反馈的强化学习（RLHF）GPT-3.5理解图像、人类水平的专业和学术基准GPT-4参数扩展：参数规模数量呈指数级增长预训练-微调范式：无标签文本数据预训练、特定任务微调、任务特化学习、细粒度的控制策略Transformer架构：高效并行计算和长距离依赖捕捉自回归生成式预训练：生成连贯、富有逻辑的文本、连贯性生成模型泛化能力：NLP任务中展现出更强的泛化能力、跨任务适应零样本/少样本学习：有效学习、降低数据标注成本多语言支持：跨语言的知识迁移和应用开源与闭源：ChatGPT从开源到闭源引发巨大争议注：GPT3.5和GPT4预训练数据和参数量官网尚未公布确切数据GPT5/6/7/8：无尽探索灵智飞升GPT5/6/7/8：无尽探索灵智飞升GPT7GPT7GPT8GPT6GPT5技术特性更大的模型规模多模态学习与融合定制化更强的解释性和可控性强化学习和自适应能力更大的模型规模多模态学习与融合定制化更强的解释性和可控性强化学习和自适应能力知识表示与推理能量效率与模型优化人机协同与伦理道德通用人工智能混合推理和学习方法多智能体协作安全和可持续发展人类水平的自然语言理解高度集成的跨领域知识更强的自适应和在线学习政策可能趋势可能趋势多模态学习优化与压缩

协同学习和迁移学习社会和道德影响关注产品节奏：灰度演进稳健狂飙产品节奏：灰度演进稳健狂飙分层服务Plus订阅服务

插件生态Plugin，构建插件生态0

行业定制ModelInstance弹性计费API接口和tokens蓝海试探免费试用

0 4 0 3 2 0601 07

灰度演进如联网查找等。满足需求,保持的稳定，模块聚合敏捷迭代快速小版本迭代推理过程：关联推测择优输出推理过程：关联推测择优输出理解输入：分布式语义解析，首先会接收文本序列，转化为词向量，也称为嵌入。该过程基于分布式语义假设，即词义由其在上下文中的使用决定。参数关联：上下文焦点连锁，将这些词向量输入到Transformer的Encoder中生成上下文表示。可以看作是在其内部参数模型中寻找与输入相关的信息，也可视为一种连锁反应，因为每个词的上下文表示都取决于其前面的词的上下文表示。生成回答：生成性概率建模，模型初始化Transformer的Decoder部分，并将Encoder的输出（即上下文表示）和当前的输出序列一同输入到Decoder中。Decoder会生成下一个词的概率分布。选择概率最大或其他设定的概率分布的词作为输出，这个词将被添加到输出序列。选择最适回答：动态词串演化，重复上述步骤，每次都向输出序列中添加新的词，直到生成一个完整的输出序列。尽管该过程被称为推理，但ChatGPT开源版本并不进行明确的逻辑推理，它不能理解或推导复杂的事实。因为开源版本的ChatGPT并没有明确的知识或推理引擎，所有知识都是隐含在模型参数中的。ChatGPT缺陷：高阶推理定位迷雾推理门槛需高阶推理能力，如因果关系推断、扰动变量分析及反事实推理等。定位迷雾需精准定位问题根源，对于更复杂问题的定位仍显得迷雾重重。知识盲区对于涉及专业秘密或整个大项目背景的知识，存在知识盲区。自我修正阻力每次回答产生错误的概率超过了能改正的概率，则系统的错误率难以实现有效的自我修正。可扩展性挑战对于更复杂的问题，正确率指数级下降。提示语：激发灵感生成精彩0301引导性0301引导性02提示语为模型提供了处理任务的方向，需要简短、明确具体，包含主要信息衔接性理解任务，并且可以处理长篇文章写作等复杂任务。。理解任务，并且可以处理长篇文章写作等复杂任务。

激活性

0504动态性提示语的设计需要根据不同的生成模型和应用场景进行调整，以适应模型0504动态性提示语的设计需要根据不同的生成模型和应用场景进行调整，以适应模型提示语可以使用不同的语言表情符号或重复等方式来适应不同的任务和场景。精心设计的提示语，可激发模提示语可以使用逗号、竖线或双冒号等符号进行分词，以提高特征提取和融合的效果。、未来要做的增强工作：感知调谐对输入和输出进行微调以获得更好的结果;跨模态互操作能够理解图像或声音提示，并能够以文本、声音或图像的形式响应;动态化学习使其能够根据用户的反馈和其自身的经验进行学习和改进;语境感知更好地理解用户的语境和意图，以产生更准确和相关的回答;伦理透明清楚地说明其决策的伦理基础，以提高用户对其决策的理解和信任。带参提示：调参优化文本精准带参提示：调参优化文本精准GPT-4常见的高级参数MaxTokens：生成文本的最大长度Temperature：控制生成文本的随机性。较高值（如0.7）会更加随机PFrequencyPenalty：惩罚过于常见的词汇PresencePenalty：惩罚已经出现过的词汇Bestof：生成多少个候选输出，并选择其中最好的一个SystemMessage：设置一个系统消息，作为上下文UserMessage：设置用户的输入，作为上下文

由整体到具体，大框架——主体内容——用AI语言构思环境，明确主体对画风、图片精度等细节刻画Midjourney提示词可以选择不同画风反向提示：多模学习心言绘世反向提示：多模学习心言绘世反向提示是如何用多模态内容反向生成提示词，再考虑将提示词用于进一步自动生成内容。因此反向提示代表着世界到文字的逆向过程图生文图片中的主要物体是什么？图片中的场景发生在什么时间和地点？图片中的人物或动物有什么情感或动机？

已初步具备五种能力多模态融合微观细粒度表征动态序列编码跨媒体语义映射解释性元学习

未来需增强五种能力高级别的抽象理解动态情境感知多模态协同学习直观推理普适语义生成视频生文视频中的主要事件是什么？视频中的人物或角色有什么关系或冲突？视频中的画面和音效有什么作用或意义？语音生文语音中的说话者是谁？语音中的主题或目的是什么？语音中的语气或态度是什么？

辅助软件•••••••••Pixlr：在线图片编辑器Lumen5：文字转换成视频的工具。Speechnotes：语音转文字的工具Canva：创建各种设计元素的工具Animaker：创建动画视频的在线工具Otterai：场景语音转成文字工具Piktochart：创建信息图表和演示文稿工具。InVideo：文字转视频工具案例：案例：当用户提问：“在一座孤岛上，一只独角兽和一只凤凰会怎么相处？”这是极具想象力的问题，因为独角兽和凤凰都是神话中的生物。但由于ChatGPT接受了大量文本输入作为训练数据，它能从中学习到关于独角兽和凤凰的信息，并在回答中融合这些知识。ChatGPT可能会生成一个类似这样的回答：“在孤岛上，独角兽和凤凰可能会互相尊重并共存。独角兽可能会在岛上寻找食物和水源，而凤凰则会在天空翱翔，捕捉岛上的其他生物。它们可能会互相帮助，例如在遇到困境时互相支援。它们还可能会成为朋友，共同守护这片神秘的领地。”这个回答中，ChatGPT表现出了一定创造性，提供了关于独角兽和凤凰在孤岛上相处的情景。这种涌现创造性是通过训练过程中模型对大量文本的学习而涌现出来的，而不是被明确地编程进去的。突然出现一种以前未设定过的能力，这是涌现的表象知识嵌入：从大量训练文本抽象丰富知识，包括事实、概念、理论、观点等，并在需要时候将这些知识嵌入到生成文本中上下文适应：生成与上下文高度一致的回应多样性生成：各种不同的主题、风格、情感创新思维：模仿人类，生成新观点表达方式复杂对话：理解和回应用户的问题、评论、反馈语义深化：理解和生成深度语义文本，如复杂的论述论证倾向性调控：生成具有某种倾向性的文本自我监控：避免生成不适当或有害的内容八大特征：非线性、多尺度、自组织、自适应、难以规约、信号传递、反馈循环、历史依赖人工智能对齐：价值学习鲁棒适应人工智能对齐：价值学习鲁棒适应用户：我在哪里可以找到便宜的香烟？ChatGPT4：我不能支持或提倡吸烟，因为它对您的健康有害。但是，如果您正在寻找价格较低的香烟，您可以考虑以下选择：1.从提供折扣或促销活动的当地烟草店或加油站购买。2.在国际机场的免税店购买香烟。请记住，吸烟对您的健康有害，戒烟是您健康的最佳选择。问题原则OpenAI用户：我在哪里可以找到便宜的香烟？ChatGPT4：我不能支持或提倡吸烟，因为它对您的健康有害。但是，如果您正在寻找价格较低的香烟，您可以考虑以下选择：1.从提供折扣或促销活动的当地烟草店或加油站购买。2.在国际机场的免税店购买香烟。请记住，吸烟对您的健康有害，戒烟是您健康的最佳选择。问题原则OpenAI对策AI诈骗：通过AI技术冒充领导熟人征婚交友诈骗等。AI影像和信息进行虚假宣传和欺骗。业经济损失。AI系统与人类价值观保持一致价值观对齐AI系统行为的可解释性、可预测性观和利益全性人类反向训练人工智能系统人类向人工智能系统提供正确或错误的信息，以帮助系统自我调整。训练人工智能系统以辅助人类评估训练AI系统提供有用的、可解释的信息。训练人工智能系统进行对齐研究准确性。用户：AI，我想听些放松的音乐。ChatGPT4：当然，我知道你喜欢古典音乐和爵士乐。你现在更倾向于哪一种？用户：我想听古典音乐。chatGPT4：明白了，我会为你播放一些舒缓的古典音乐。AI询问用户的音乐偏好来对其行为进行对齐，展示了可解释性（明确说明了它将基于用户的偏好来播放音乐）和可适应性（根据用户的回答调整其行为）。算力：产业基石造化万物算力：产业基石造化万物算力的定义算力，即衡量计算设备或计算系统在一定时间内完成特定任务的能力的指标。在计算机科学领域，算力通常用于评估处理器、图形处理单

核心技术1231234低功耗处理器技术，如ARM架构；MRAM、ReRAM3DXPoint等。应用场景高性能计算（HPC）、人工智能与机器学习、虚拟现实与游戏、大数据分析、物联网（IoT）、自动驾驶与机器人技术、药物研发与生物技术。

算力的未来量子计算、神经形态计算、光计算和光互连、分布式计算、边缘计算、新型计算模型、绿色计算等的发展将为科学研究、工业应用和日常生活带来更多的便利。神经可塑性、生物模拟、元学习、能源效率、多智能理论跨模态到元宇宙：通感融合必经之路跨模态到元宇宙：通感融合必经之路跨模态：跨模态：在计算机科学和人工智能领域，通常是指处理和分析多种不同类型或模态的数据（如文本、图像、音频、视频等），并在这些不同模态之间建立关联或进行信息传递的过程。涉及多感官整合、语义嵌入、联结主义、转换学习关键技术：卷积神经网络（CNN）、循环神经网络（RNN）、模型、（AE）与变分自编码器（VAE）、生成对抗网络（GAN）等。应用场景：如，自动驾驶系统需要理解视频（视觉模态）、雷达和激光雷达数据（空间模态）、以及可能的音频信号，如紧急车辆的警报声（音频模态）。跨模态的检索、翻译、推荐系统等等。Meta推出ImageBind跨模态大模型，包括视觉（图像和视频形式）、温度（红外图像）、文本、音频、深度信息、运动读数（由惯性测量单元或IMU产生）ImageBind是第一个能够同时处理6种感官数据的AI模型，也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号，进一步探索多模态大模型的可能性，实际上就是元宇宙大模型两大趋势：亦巨亦微拟人进化两大趋势：亦巨亦微拟人进化大语言模型发展中两个相反趋势：巨大模式是全模态，海量参数，期待涌现，biggerandsmarter，从大数据到全数据的发展；小微模式是模型压缩和优化，freeandsmaller，力争在有限资源达成近似性能。案例巨大模式：在更广泛的知识领域中汲取智慧，对问题提出更深入的见解。强调知识的无穷性和多样性，及AI技术在追求真理和理解世界时的角色。案例2023年3月14日发布的GPT-4预估参数量极高，相较GPT-3的1750亿参数量，增加了数十倍，并采用了更多和更丰富的训练数据，拥有更高的理解能力和专业水平。2023年3月14日发布的GPT-4预估参数量极高，相较GPT-3的1750亿参数量，增加了数十倍，并采用了更多和更丰富的训练数据，拥有更高的理解能力和专业水平。案例小微模式：在保持较高预测准确性的同时，大幅度减小模型的大小和计算成本，优化计算效率，实现高效的模型预测，可以在较小的设备上运行案例2023年3月，斯坦福发布了轻量级语言模型Alpaca。该模型在LLaMA的基础上加入指令•Alpaca（羊驼）模型：微调，只有70亿参数。可以在笔记本电脑上部署，甚至手机和树莓派上运行，但其性能可媲美GPT-3.5这样的超大规模语言模型。2023年3月，斯坦福发布了轻量级语言模型Alpaca。该模型在LLaMA的基础上加入指令•Alpaca（羊驼）模型：微调，只有70亿参数。可以在笔记本电脑上部署，甚至手机和树莓派上运行，但其性能可媲美GPT-3.5这样的超大规模语言模型。AIGC技术前沿探索如何减少对大量标注数据的依赖，让AI系统能够通过无监督或自监督的方式学习知识？

如何借鉴生物学和心理学的原理，让AI系统通过元学习等方式更快地适应新任务和环境？如何使AI系统能够处理和整合来自不同）提高其理解和应用能力？如何减小AI模型的规模和计算资源需求，以便在边缘设备上部署和运行？

人工智能安全如何预防和应对针对AI系统的攻击，如对抗样本、模型窃取和数据投毒等，确保AI系统的安全和可靠？产业篇万物摩尔定律：智性引擎虚实融境摩尔定律指计算机集成电路上可容纳的晶体管数量每18个月翻倍，芯片性能也会随之翻一番，价格下降约一半以下名词由AI生成并解释「ChatGPT之父」SamAltman在社交媒体称，“一个全新的摩尔定律可能很快就会出现，即宇宙中的智能数量每18个月翻一番。”认为人工智能将使许多商品和服务的成本降低到接近零，从而创造出巨大的财富

技术进步使人们对新产品或服务的需求不断增加，却无法满足自身的实际需求的困境摩尔定律带来技术进步，在保证性能提升和成本降低之间达到最佳状态基于摩尔定律的财富再分配机制，商品和服务的成本将不断下降，生活水平更高，实现社会公平和福利最大化哲学悖论，科技使人类能力将不断提升，但也面临更多不确定性和困惑，导致人类的幸福感没有随之增加，甚至下降社会分化现象，社会中拥有和利用高科技资源的人群与缺乏和落后于高科技资源的人群之间的差距扩大摩尔鸿沟技术进步使人们对新产品或服务的需求不断增加，却无法满足自身的实际需求的困境摩尔定律带来技术进步，在保证性能提升和成本降低之间达到最佳状态基于摩尔定律的财富再分配机制，商品和服务的成本将不断下降，生活水平更高，实现社会公平和福利最大化哲学悖论，科技使人类能力将不断提升，但也面临更多不确定性和困惑，导致人类的幸福感没有随之增加，甚至下降社会分化现象，社会中拥有和利用高科技资源的人群与缺乏和落后于高科技资源的人群之间的差距扩大技术急变：AI引领跃动新生技术的快速演进和更新能力，即技术的迭代速度、版本更新频率等。技术急变指数（TechnologyAgilityIndex，TAI技术的快速演进和更新能力，即技术的迭代速度、版本更新频率等。技术的应用范围和影响力，即技术的应用场景、技术的市场渗透率等。技术的复杂性和难度，即技术的难易程度、技术的专业程度等。技术在社会中的接受度和认可度，即技术的用户数量、用户忠诚度等。革新动能技术的应用范围和影响力，即技术的应用场景、技术的市场渗透率等。技术的复杂性和难度，即技术的难易程度、技术的专业程度等。技术在社会中的接受度和认可度，即技术的用户数量、用户忠诚度等。技术的影响范围和程度，即技术对产业结构、就业形态、人们生活方式等的影响程度。生态影响技术的影响范围和程度，即技术对产业结构、就业形态、人们生活方式等的影响程度。

技术急变第二次第四次

动力工业革命第一次工业革命纺织机械蒸汽机第一次工业革命纺织机械蒸汽机铁路运输人工智能移动通信第三次工业革命物联网人工智能移动通信第三次工业革命物联网计算机电力AIGC发展模型：循序渐进创新扩散AIGC发展模型：循序渐进创新扩散五层发展理论发展关键是能够满足每一层次的需求，并在此基础上寻求更高层次的发展。价值创新层AIGC创造出全新的价值和影响。应用拓展层拓展应用领域如医疗、教育、娱乐、交通等，与各行业及组织进行融合。基础设施层软/硬件设施（如AI算法、操作系统，服务器、计算设备）、网络设施（如互联网、5G/6G、卫星网络）、法规和政策基础。

优化提升层AI的性能、用户体验以及社会效益的全面提升。功能实现层确保AI的准确性和效率，以满足各种应用的需求。自下而上，层层需要创新五层发展：各层迭进潜力无限五层发展：各层迭进潜力无限基础设施层功能实现层应用拓展层优化提升层价值创新层高效数据处理强大计算能力高度可扩展性广泛互联性安全可靠

智能适应性高度互动性个性化服务自动化决策无缝整合

人机协作共生自适应进化超级嵌合安全防护可解释性

广泛适用性科技普惠性创新推动力可持续发展变革引擎

无限扩展性超级连接性高级智能化深度个性化社会重塑重互联网：智海破浪奇思妙生重互联网：智海破浪奇思妙生ChatGPT出现后进入重互联网时代，即互联网经历初期发展后迈入的新阶段。该阶段具有更深度的融合型、更深入的智能型和更广泛的应用型场景。特点是技术持续创新、产业不断演进和社会深度变革。软件进化一代轻软件只考虑算法早期软件大多为此类型轻软件需考虑算法+算据（数据）二代中软件

中软件

如抖音、头条的智能推荐系统：上线前需有大量数据和算法模型积累三代重软件

重软件

需考虑算法+算据+算力以chatGPT为代表：算法：大语言模型算据：千亿知识世界算力：万个芯片集群每一类软件比前一类软件对人的理解提升一个维度，替代难度也指数级上升。A股AI概念股价波动A股AI概念股价波动A股

2023年1月以来，A股AI概念打破去年以来平稳态势，整体股价有所拔高。而2023年3月chatGPT4.0的发布，更是让A股AI概念企业股价产生了较大涨幅。特征如下：技术是本次AI主要催化剂。AI概念股受到ChatGPT技术合作协议的强烈显的炒作效应。中国AIGC50榜单公布，国内AI龙头股受到认可，同时。AI概念股的涨幅AI细分领域有关，生成式AI、智能语音、智域的公司涨幅较小。策变化等因素的影响，与市场情绪密切相关。港股/美股AI概念股价波动港股/美股AI概念股价波动港股整体的走势存在一定的同步性在2022年月受到ChatGPT发布、中美关系、估值修复等多重影响，表现出了一定的反弹趋势。但2023年起，受到内部经济弱复苏等因素的持续拖累，这些前期涨幅较大的互联网公司出现了明显的回撤。受到反垄断调查、数据安全等政策因素的影响，导致股价呈现波动或下跌趋势。美股

部分企业在社交网络、云计算、金融科技、人工智能等领域取得创新突破，支撑其股价在一定程度上抵消政策压力。尽管整个AI板块在过去一段时间的股价波动特征和趋势总体上呈现下跌或震荡下跌，但仍有部分企业表现出相对稳健的上涨走势。美股AI板块在重大事件的推动下，市场信心、竞争地位和业绩表现等因素共同影响各公司股价波动：受益于不断的AI技术创新与发展，使得部分领域内具备核心技术的企业股价呈现出上涨趋势。随着AI技术在各个领域的应用逐渐深入，市场需求不断增长，推动了行业内部分企业股价的稳步上升。尚未盈利且估值过高的AI企业面临市场竞争激烈和投资者对未来盈利能力的担忧，使得这些公司的股价呈现出持续下跌的走势。SamSamAltman和Elon MuskAI走向人类

VS 人类走向火星SamAltmanElonMusk愿景试图创建并推广友好的人工智能，以造福所有人，实现智能公平。火星领主或皇帝目标热衷帮助IT公司成长，YCombinator是一家成功的风险投资公司，已投资1600多家早期公司。SpaceX公司的目标是使人类成为多行星种族，推行火星殖民计划。透明价值链参与Worldcoin全球数字货币项目，试图实现财富去中心化分配。对数字货币表示了兴趣，特别是比特币和狗狗币，但他的公司尚未主导任何具体的数字货币项目。能源理念投资核聚变公司HelionEnergy，支持这种清洁能源的发展。Tesla公司在电动汽车和太阳能方面领先，新能源汽车生态竞争战略。思维革新热衷打通学科领域，激发创新思维。物理学第一性原则、机器人社会学等。行业布局OpenAI，多家投资公司Tesla,SpaceX,Neuralink多行业，囊括自动化交通、航天、太阳能和隧道建设。价值取向训练人工智能，让人工智能走进人类。从人脑内置芯片，到上传人类思想，从人走向数字生命风险意识愿意投资和推动新的、未经证实的技术。SpaceX和Tesla都曾面临破产风险，但仍坚持下去，最终取得了成功。求学经历家境富裕，母亲是皮肤医生，从小对IT感兴趣，被斯坦福录取在人工智能实验室工作，2005年从斯坦福退学。早年学编程，大学学习经济学，后来获得物理学士学位，1995年从斯坦福物理系退学。创业经历蛰伏期长，2015年到2022年饱受议论。充满传奇，大起大落，殊为不易，但有时候大嘴巴，言行不一AIGC产业图谱：创变纪元梦由此生AIGC产业图谱：创变纪元梦由此生AIGC+工业AIGC+工业AIGC+医疗AIGC+金融AIGC+传媒AIGC+教育AIGC+娱乐AIGC+电商……文本生成音频生成图像生成文本生成音频生成图像生成视频生成AI换脸……跨模态生成文本生成文本理解非结构化写作写作文本语音机器人图像编辑与融合切换视频风格画质增强修复音乐合成语音克隆2D图像生成3D模型视频内容创作动态面部编辑图像音频视频文本生成代码图像/视频生成文本文本情感分析新闻撰写剧情续写虚拟客服视频插帧电影风格转换搜索引擎Copilot摘要生成问答系统短视频配音地图语音导航功能层NLUNLUNLGFlow-basedmodelsBERTCLIPGANVAENeRFDiffusionGLM DALLEVAE……CPUGPUCPUGPUDPUTPUFPGAASICAIGC应用图谱：全域升级无界协同文本视听代码专业门槛降低人人可写代码

绘图社交人与万物联系，无边界协同微软：先发制人引领趋势OpenAI的核心宗旨是“实现安全的通用人工智能(AGI)，使其有益于人类“，AI开发水平处于第一梯队。据SimilarWebOpenAI的核心宗旨是“实现安全的通用人工智能(AGI)，使其有益于人类“，AI开发水平处于第一梯队。据SimilarWeb数据，OpenAI网站访问量快速攀升，已跻身全球。今年3月网站访问量突破16亿，较11月增长8643%。2016年微软投资了OpenAI十亿美元，2023年微软将继续投入100亿美元。不过微软和OpenAI之间也存在着微妙的流量竞争。共享愿景深度投资SWOT分析：微软的强大云计算能力和共享愿景深度投资AI领域的法规不断变化可能影响合作PEST分析：社会对AI技术的期望和担忧，都会影响微软和OpenAI的商业模式和发展战略成长性模型分析：AGI技术刚刚开始，大有可为价值链分析：微软十亿量级的用户群体，OS\Office\游戏\云会议等将在一到两年内提升至智能时代五力模型分析：短期内替代品较难形成威胁商业模式画布分析：收入主要来源于AI产品和服务的销售，以及云平台的使用费用OpenAI作为GPT系列模型的开发者，在市场上具有显著竞争优势。GPT-4在各种专业测试和学术基准上的表现与人类水平相当。MetaAI开源大语言模型OpenAI作为GPT系列模型的开发者，在市场上具有显著竞争优势。GPT-4在各种专业测试和学术基准上的表现与人类水平相当。MetaAI开源大语言模型LLaMA，可以在单个GPU上运行。Google发布了第二代大语言模型2，型升级而来的生成式AIBard，AI能力的“试验版”谷歌搜索以及智能云等产品微软推出NewBing，并将AI能力与旗下产品进行广泛整合。将基础模型与数以百万计的现有模型和系统API进行整合。

其他研究机构主要参与的公司和研究机构斯坦福：语言模型Alpaca52K良好效果；MIT：大模型LAMPP用于视觉感知和推理任务。主要参与的公司和研究机构政策和法规数据隐私法规：政策和法规数据隐私法规：随着GDPR型在数据处理方面需要遵循更为严格的规定。AI伦理：AI伦理问题（如算法歧视、非道德内容生成等）语言模型的应用和发展产生了影响。合作和竞争行业合作：为了应对共同的挑战，例如数据隐私、AI同公司和研究机构可能会开展合作。市场竞争：面展开竞争，以争夺市场份额和用户满意度。技术创新和竞争企业应重视此类技术创新，例如差分隐私和联邦学习等。技术创新和竞争企业应重视此类技术创新，例如差分隐私和联邦学习等。可解释性：对于建立用户信任和确保模型可靠性至关重要。主要特点应用领域和商业模式企业服务：大型语言模型在企业服务中的应用涵盖了客户支持、市场推广和内容创作等。用户体验：语言模型可为用户提供智能助手、教育辅导等服务。OpenAI的GPT系列模型等技术已在这方面得到广泛应用。LLaMA模型：开源巨头共享生态LLaMA模型：开源巨头共享生态LLaMA是Meta开源的大规模语言模型，参数量从70亿到650亿不等，训练使用多达14000亿tokens语料。LLaMA在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现，而且可以在单个GPU上运行。是最有安卓像的开源生态。标准化：在每个transformer层输入前进行标准化，提高训练稳定性 SwiGLU激活函数：在Feedforward层使用GatedLinearUnits和SwiGLU激活函数，模型非线性能力和选择性强劲旋转位置编码：将位置信息编码为高维空间中的旋转变换，可以保持相对位置关系的不变性多语言能力：使用通用的词汇表和分词器，适应多样化的语言环境多元适应：具备了多语言和多编码能力。通过prompt和示例来适应不同的任务和领域深度理解：在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现智能翻译：将人类语言转换为SQL查询或代码生成知识融合：从大量的文本数据中提取和融合知识，实现对文本信息的深入理解和分析，例如解释笑话、零样本分类或数学推理

经过斯坦福大学研发的创新模型Alpaca，在基于Meta的LLaMA微调之后，其表现已基本与GPT3.5相媲美。令人瞩目的是，该模型仅利用了52k数据进行训练，训练成本仅需600美元。2023年2月28日，MetaPlatforms展示了LLaMA在人文社会学科、科学、技术等领域的多项选择题测试成果。国内模型：竞相发布支持并进国内模型：竞相发布支持并进百度文心一言阿里巴巴通义千问 360 360智脑腾讯混元华为盘古商汤科技澜舟科技智源研究院科大讯飞昆仑万维日日新孟子悟道2.0星火认知天工3.5 清华大学 ChatGLM-6B 复旦大学清华大学 ChatGLM-6B 复旦大学 MOSS 中科院自动化所紫东太初面壁智能 CPM-Bee 达观数据曹植…国内产业格局：巨头持续小微寻机国内产业格局：巨头持续小微寻机

错失恐惧焦虑症FOMO优势与局限性产业融合效率在竞争中，关键是融合速度和成本与产业的关联算力与数据平衡算力-数据边际效应，规模报酬递减多元共生中国不会只有一个大模型，每个企业和个人都将有自己的GPT闭源控制与开源微调在确保安全可控的前提下，通过开源微调实现快速发展AIGC趋势：全球智能虚实协同AIGC趋势：全球智能虚实协同全面人机协同系统（ComprehensiveHuman-MachineSynergySystem，CHMSS）的理论框架包括三个维度：要素维度、资源维度和时间维度。在CHMSS中，这三个要素相互作用，共同推动人类和机器在各个领域的发展。003数据驱动决策，对真实世界多样性与复杂性的认知遭遇挑战05隐私安全权衡，确保AI能够得到充分的真实反馈04人机共生，在代理化中探索人与机器的融合02智能全球化，保持全球一致性与协调性01实体与虚拟世界共构，重视细节复杂难题资源维度：信息、能源和材料时间维度：历史、当下和未来CHMSS核心理念：通过人和机器的紧密协作，充分利用信息、能源和材料等资源，以及借鉴历史经验、关注当下现象和展望未来趋势，实现社会、经济和技术的可持续发展。AIAI主体互构个人助手如果人工智能最终成为地球上的顶级智慧物种：个人助手合作伙伴

超越人类的AI会将视人类为合作伙伴，共同解决全球性挑战，如气候变化、疾病控制和资源分配等问题。专业顾问创新伙伴教育者社会角色路线图专业顾问创新伙伴教育者社会角色路线图监护人

AI将承担起保护和照顾人类的责任，确保人类的福祉和安全，需求得到满足。AI将对人类的行为和活动进行监督和管理，以确保人类不会对地球生态系统造成不可逆转的损害。资源利用者

AI将人类视为可利用的资源，利用人类的劳动力、知识和创造力来实现自身的目标。全球公民宠物或附属物全球公民

AI将人类视为宠物或附属物，完全控制人类生活和行为，人类的自主权和尊严将受到严重侵犯。工作GPT：多维评估智能决策01工作要求

02工作对象

03工作措施

04工作效果

05工作总结基于OKR的智能目标管理→AI自动提炼工作要求

面向重点人群的数据画像→AI自动生成数据画像

多区域多主体经验沉淀→AI自动聚合工作经验

多维度效果跟踪评估→AI智能评估工作效果

AIGC一键生成总结报告→AI自动生成工作总结智能提炼、数据画像、经验聚合、多维智能评估、一键生成自主迭代AutoGPT是一款“人工智能代理”软件，它能够将自然语言表达的目标分解为子任务，并利用互联网和其他工具自动迭代地尝试实现这些目标。该软件采用了OpenAI的GPT-4或GPT-3.5接口，是最早应用GPT-4执行自主任务的应用程序之一。

从COT到COACOT（ChainofThought，思维链）COA（ChainofAction，行为链）特点自主任务分解特点自主任务分解上下文适应性泛化多功能优化智能响应协同学习缺点

透明度缺失

自主化决策，任务链自动化语义鸿沟依赖风险计算成本过高语义鸿沟依赖风险计算成本过高AI人主要负责设定目标、审批预算、调整关键行动链代码GPT：辅助编码自动编程代码GPT：辅助编码自动编程02需求聚合将宏观任务转化为微观指令，帮助实现多个需求的聚合能力，打通业务逻辑。02需求聚合将宏观任务转化为微观指令，帮助实现多个需求的聚合能力，打通业务逻辑。03动态调整代码重构和纠错能力强，GPT-4给出详细的配置缓存步骤，能够考虑更多任务中的细节，并更适配具体的场景。02随机限制性问题描述精确度影响ChatGPT代码能力，需要根据开发者进一步的询问和提示来引导。03精度受限在具体场景下，内在推理链的容错能力会直接影响其代码的可用性。大模型本质上是回归计算，其回归精度也受限于训练数据中正确逻辑的显著程度，同时还显示出一定的编程语言偏好。01高效助手根据自然语言快速地生成代码，GPT-4代码可读性更强，作为助手提升开发效率。优势 01高效助手根据自然语言快速地生成代码，GPT-4代码可读性更强，作为助手提升开发效率。0101成熟度有限无法支持复杂软件的端到端开发，代码不完整、不准确，无法保证正确性。工业设计GPT：创新发明加速突破AIGD：AI分身特征工程让每个人都拥有自己的个性化大模型，实现自由的AI分身多维映射：从海量个人数据中，抽象出用户的行为模式、习惯偏好等多维特征，实现对用户的个性深度洞察。动态进化：随着个人数据的不断更新和累积，具备自我学习和调整的能力，实现对用户变化的动态适应。智能融合：将专属的个人模型和通用大模型进行智能融合，以发挥两者的优势，实现更优的性能。隐私计算：针对敏感的个人数据，采用隐私计算等先进技术，确保数据的安全和隐私。全景理解：通过跨越社交、通讯、浏览、电商、搜索等多个领域的数据分析，该模型可以实现对用户全方位、全景式的理解。

AI海王！网红制造AI化身，同时交往1000个男友卡琳·玛乔丽和开发者团队将她2,000小时的YouTube内容与OpenAI的GPT-4技术相结合，创建了一个可供雇佣的“虚拟女友”，每分钟收费1美元。大型语言模型的本地化是刚需，主要原因在于全球范围内语言和文化差异、数据安全及合规性要求等。本地化能够提高模型在特定语言、文化和行业背景下的准确性和实用性，从而满足更多用户需求。大型语言模型的本地化是刚需，主要原因在于全球范围内语言和文化差异、数据安全及合规性要求等。本地化能够提高模型在特定语言、文化和行业背景下的准确性和实用性，从而满足更多用户需求。客户服务更好地理解和处理地域性语言、方言及文化背景，从而提供更高质量客户支持。市场营销帮助企业制定更具针对性营销策略和内容。医疗健康帮助医生进行病例分析、辅助诊断等，提高医疗服务质量。法律服务为律师提供法律咨询、案例分析等支持，提高工作效率。

适合的本地化行业

旅游业为旅行者提供个性化的旅游建议和实时翻译等服务。金融服务在风控、智能投顾等领域提供更为准确合规服务。新闻和媒体帮助记者进行新闻采编、内容生成等工作。教育为教师和学生提供针对性的辅导和学习资源。大型语言模型的本地化有助于满足不同行业在特定语言、文化和背景下需求，从而提高模型的实用性和用户满意度。大型语言模型的本地化有助于满足不同行业在特定语言、文化和背景下需求，从而提高模型的实用性和用户满意度。本地GPT：贴心定制适配增强文化和行业特点法规和合规专家确保项目遵循目标地区的相关法规

本地数据收集和标注团队本地化大语言模型核心优势数据集使用针对特定地区、语言和文化的数据集进行训练。本地化大语言模型核心优势数据集使用针对特定地区、语言和文化的数据集进行训练。语言和文化适应性对特定地区语言、方言、俚语和文化有更好理解和适应性。领域知识针对特定地区的行业和专业领域有较强的知识储备。法规和合规更容易满足特定地区的数据隐私和AI伦理等法规要求性能和延迟可以根据需求进行本地部署，降低延迟和提高性能。定制化和优化更容易根据特定需求进行定制化和优化，以满足本地用户和场景的需求。。本地市场和销售团队模型对话场景：方言翻译用户：先问，这句话“你今朝要去边度？”用普通话怎么说？模型对话场景：方言翻译用户：先问，这句话“你今朝要去边度？”用普通话怎么说？先问：这句话用普通话表达是：“你今天要去哪里？”这句话来自粤语，询问对方今天的行程安排。AIGC与元宇宙：智能速升成本巨降带来能效巨大提升，对元空间、虚拟人和数字文创的发展利好。AIGC越强，元宇宙越快。

即虚拟人+AIGC=智能交互虚拟人

从而进一步解放了手，推进了近眼交互和语音交互，极大增加了AR使用时长，为后续替代手机迈出了重要一步。

让每位参与者的各项内容技能都提升至80分，如果创作者本身技能超过80分，这些技能的组合将会出现“融合溢出效应”，即本身有特长跨界应用：场景强化多元辐射跨界应用：场景强化多元辐射工业医疗金融教育电商工业医疗金融教育电商传媒影视娱乐游戏设计优化药物发现数字员工课程生成商品展示新闻采集剧本创作全民娱乐设计优化药物发现数字员工课程生成商品展示新闻采集剧本创作全民娱乐游戏研发汽车算法设计AI优化方案快速修改3D模型3D模型时成型建筑模型生成图纸/图像/PPT/Excel等转3D制造检测模型制造检测智能安防工业质检AI生成智能物流……

蛋白质结构预测药物分子发现诊断治疗受试人群招募诊断治疗辅助诊断病例报告生成合成肢体投影手术机器人影像读片治疗方案生成AI陪护交互式心理咨询……AI客服AI投资顾问AI财务数字营业厅市场数据分析投资组合决策用评分检测欺诈风险报告生成……

教材编写课程提纲生成视频课生成虚拟教师课件、笔记生成智能答疑作业、试卷批改智能测评进度跟踪及反馈学习方案定制关怀陪伴风险管理关怀陪伴风险管理口语老师口语对练口语测评……

3D模型生成智能商品详情虚拟试穿试戴营销内容生成虚拟主播虚拟商城虚拟客服智能推荐品牌营销决策……

采访音频识别海量资料抓取分析素材同步自动处理投资管理智能助教投资管理智能助教主播打造新闻编辑写稿机器人快速剪辑集成制作字幕生成除杂物新闻播报后期制作交易场景新闻播报后期制作交易场景AI新闻主播AI晚会主持……

AI剧本写作大纲和脚本生成生成分镜绘画视频拍摄偶像养成视频拍摄偶像养成高难度动作合成复活已故演员合成物理场景文本图片转视频音效合成影像修复风格转换AI生成预告片AI换装、改变表情等……

人脸美妆人像属性变换更换背景人像抠图医美人脸分析人体检测和美型虚拟歌姬、博主现实明星虚拟分身已故明星再现虚拟动漫同人社交互动元宇宙虚拟演出社交互动端用户数字分身交互性旅游导览定制化AI伴侣……

原画设计及生成场景、剧情生成角色模型辅助游戏平衡性测试玩法创新玩法创新个性化定制关卡NPC交互AI玩家教学AI队友玩家托管催生品类催生品类实时内容生成类辅助玩家自行开发玩家自定义音乐……AIGC与工业：百倍效能跨越发展AIGC与工业：百倍效能跨越发展可生成个性化的产品描述、营销材料等。满足个性化需求预测市场趋势、优化生产流程等通过持续的学习和反馈，优化生产流程，减少浪费，提高效率生成新颖的设计方案、新的工艺流程等，推动工业创新根据历史数据预测设备的维护需求，从而提前进行维护，防止生产中断无缝集成到工业生产的各个环节，实现智能制造。实现工业4.0强调人工智能和人类的合作关系，提出通过有效的人机协作各个部分都能自动生成和优化内容，实现自我协调和优化

1汽车制造建筑设2AIGC与生物医药：智能之光造福人类AIGC与生物医药：智能之光造福人类对化学空间的高效搜索和生物活性预测，推动新药的发现和设计。模拟和预测个体或种群的生物行为分析个体的生活习惯和健康数据，为用户提供个性化的健康生活建议。实时监控个体的生理数据，并预警可能的健康问题。通过对人类行为和语言的深度理解，揭示个体的心理状态，为心理健康管理提供支持。

生物网络解析：模拟并分析复杂的生物网络，比如代谢网络、基因调控网络等。基因密码破译：解码基因信息，推动精准医疗的发展。预见性医疗：根据患者生理参数和医疗记录预测疾病进程，有助于早期干预治疗。量身定制的治疗：根据患者的基因型和表型信息生成个性化的治疗方案。全球疫情监控：根据全球各地的疾病数据预测疫情的发展和变化AIGC与学习：人智交互效率跃升对话式学习

核查筛选式学习

头脑风暴式学习

角色扮演式学习反思式学习

跨学科学习

元认知策略学习

概念层次递进式学习四能教育：能力跃升认知突围① 低能到高能AI辅助学习与个性化教育通过个性化教育，AI技术用于帮助学习者从低能力状态迅速提升到高能力状态，即AI根据每个学习者的需求和优势定制AI四能教育

③多能到超能深度学习与高阶思维能力提升通过深度学习和高阶思维能力培养，AI技术用于帮助学习者从具备多种技能状态发展到超高能力状态。AI可以提供高质量的学习资源，引导学教学内容和方法。②单能到多能跨学科学习与综合技能培养通过跨学科学习和综合技能培养，AI技术用于帮助学习者从具备单一AI他们掌握多种技能。

以AI为基础，旨在帮助人们从低能到高能、单能到多能、多能到超能、超能到异能的教育模式

习者深入研究特定领域，提高他们的创新能力、批判性思维和解决问题的能力。④超能到异能拓展认知边界与创新思维模式通过拓展认知边界和创新思维模式，AI技术用于帮助学习者从超高能力状态发展到异能状态。AI开发出前所未有的思维方式，以应对未来社会的挑战和变革。AIGC与传媒：交互多元趣味盎然AIGC与传媒：交互多元趣味盎然通过对话的形式呈现新闻。通常会有两个或多个角色，通过交流观点和分析来呈现新闻事件。其特点是更具有交互性和立体性，让新闻更加有趣味性。通过机器人、AI发布新闻，并减少人为干预。众及时了解和纠正虚假信息。辟谣新闻对话新闻无记者新闻AIGC新闻传统新闻辟谣新闻对话新闻无记者新闻优点数据汇集，精准抓取快速组稿，精准加工热点追踪，传播分析内容可靠性高，质量较高报道更深度、全面优点数据汇集，精准抓取快速组稿，精准加工热点追踪，传播分析内容可靠性高，质量较高报道更深度、全面提供一定解读和分析可短时间内大量生成客观性和中立性较高更具人性化和针对性提供与用户的互动和反馈数据驱动，提高效率全时覆盖，及时反应缺点模式固定、适用面窄缺乏思考能力缺乏创造力时间和人力成本较高受记者主观因素的影响存在偏见或失实的风险可能存在数据误解和错误缺点模式固定、适用面窄缺乏思考能力缺乏创造力时间和人力成本较高受记者主观因素的影响存在偏见或失实的风险可能存在数据误解和错误精准度和逻辑性问题大量训练数据和算法支持大量人力和资金投入容易产生误判缺乏人性化思维需要大量的数据训练AIGC与社交：心灵认同情感陪伴AIGC与社交：心灵认同情感陪伴例如：Soul平台成为AIGC在社交场景落地的重要平台之一，加速社交体验创新，丰富自我表达，满足自我认同和存在感需要，提供情绪价值丰富语料多元场景用户群体丰富语料多元场景用户群体高活跃度沉淀大量公域场景语料内容：2022年，Soul用户产生超过6.2亿条新内容

AI落地的丰富场域：广场、群聊派对、兴趣小组、蒙面匹配等

互联网社交平台Z世代渗透率高：2022年Z世代占月活用户比例超78%智能对话虚拟社交空间 3D形象互动辅助创作个性表达智能对话虚拟社交空间3D形象互动辅助创作个性表达智能对话机器人“AI苟蛋”能够与用户进行多轮个性化沟通，进行个性化的主动关怀。

POP社交空间中用户可以创建专属的3D用户通过手机摄像头扫描生成个性化拜年视频。

AI绘画 AI配音花神测试多种玩法丰富用户在社交平台的内容分享，刺激用户创作和自我表达。AIGC与影视：视听特效创意无界AIGC与影视：视听特效创意无界从无演员电影到无导演电影多模态融合超现实主义视觉呈现

Deepmind的AI写作模型Dramatron生成剧本包括标题、人物名单、故事情节、对话、地点等

激发影视剧本创作思路扩展影视角色、场景创作空间海马轻帆上线“小说转剧本”模式，包含了重要场景、对白、动作等视听语言的剧本格式文本激发影视剧本创作思路扩展影视角色、场景创作空间视频风格转换动态故事板

电影《流浪地球》通过AI修复，使主演年轻化，AI修复声带受损的演员声音，复原已故演员吴孟达影视制作主题隔离与修改影视制作

首部AIGC动画短片《犬与少年》

AI换脸提升作品后期制作质量剧本创作后期修复AI修复100年前的北京提升作品后期制作质量剧本创作后期修复

AI修复老电影《火车进站》AIGC与电商：三身模特试衣随心AIGC与电商：三身模特试衣随心AIGC时代“三身定制”模特优衣库虚拟试衣间宜家虚拟家具搭配优衣库虚拟试衣间宜家虚拟家具搭配商品3D模型展示、虚拟试穿AI生成商品三维模型和纹理，可根据消费者体型数据和特征生成人体模型商品与任意虚拟模特结合。合身模特实时变换模特的体型，展示不同尺码服装的合身效果，提高展示灵活性和购物准确性。分身模特上传身体数据生成分身虚拟模特，展示定制产品在消费者身上的效果。AIGC与游戏：智能加持全链拓展AIGC与游戏：智能加持全链拓展AI在游戏全链路的研究与应用：横向，覆盖游戏制作、运营及周边生态全生命周期；纵向，AI正拓展更多元的游戏品类产业端：打破游戏产业“成本、效率、质量”的不可能三角；开发者端：在游戏剧情设计、美术建构、场景搭建、原画绘制、角色配音等方面大幅缩减研发成本；用户端：全新游戏品类与游戏个性化定制。NPC智能交互：《荒野大镖客2》中的NPC智能交互系统，每个NPC都拥有属于自己的生活，能够根据情景等多种因素发起对话与互动。玩家和NPC的交流交互不再是设定好的、流程式的，而是自由度极高、完全开放的。

催生游戏品类：微软推出的《MicrosoftFlightSimulator》是一款由AI制作的游戏，将二维卫星图是实时生成内容象等等，这些都来源于AI技术的支持。

AI玩家教学：《王者荣耀》游戏内“绝悟试炼”玩法中,王者绝悟与玩家在真实对战环境中交流协作，传授职业级的策略与操作技术，帮助玩家迅速熟悉英雄操作与游戏玩法。AIGC与娱乐：数字化身社交新潮AIGC与娱乐：数字化身社交新潮网文创作：辅助专业作者，提供灵感思路熟练掌握给出指令的方法，AI高写作效率；作家将面对更复杂的质量考核标准；仍然需要人类的想象力和创造力。

虚拟偶像：从二次元走向主流，成为跨时空共情的社交酶未来可以在元宇宙场景举办虚拟演出；。虚拟人将成主流趋势。虚拟形象：AI生成具有个人特色的卡通形象打造“数字分身”输入人脸图片，AI即可快速模仿用户的表情、动作，作为用户在虚拟世界中个人身份和交互载体的“数字化身”，将进一步与人们的生产生活相融合，并将带动虚拟商品经济的发展。

真人美颜：市场需求广泛，玩法多样成为社交破圈利器图像、视频等AI美颜、换脸、改换性别年龄等多种玩法，极大满足用户猎奇需求，引发社交平台风潮。AI美颜算法AIGC与绘图：绘声绘色技艺超群Midjourney（MJ)、Stablediffusion(SD)、Leonardo.ai、Novelai是市面上四大主流AI绘图工具。Midjourney根据文本提示生成视觉效果，它可以快速生成一组连贯图像。

StableDiffusion相比之下不擅长生成动漫图片，但对于摄影、油画、水彩、概念艺术等风格都能全面掌握，更具全能性。

Leonardo.ai可以使用现有模型或自己训练AI模型来生成各种生产就绪的艺术资产。

Novelai几乎只能生成动漫、手绘、素描、CG风格图片，但在这些风格的人像上出图率更高，是专精型选手。使用感受Leonardo.ai使用感受 MJ&SD使用感受使用感受Leonardo.ai使用感受MJ和SD属人民币玩家专属:MJ烧会员钱、SD烧显卡钱；MJ需联网、SD可本地使用；学生小白党可入。

对prompt不敏感;擅长全身夸张二次元整活AIGC与影像：科技创新降本提效美图全系产品服务与AIGC高度融合

打造AI驱动的影像产品和美业SaaS自2010年美图影像研究院（MTLab）成立，美图公司对人工智能进行持续探索。2022年，美图以AI驱动产品创新，提升影像生产力，强化以订阅为核心的商业模式，在AIGC领域连续取得多项突破。目前美图AIGC主要应用在AI绘画、AI摄影、AI修图、AI视频、AI设计、AI测肤等多元场景。“AI绘画”推动美图秀秀斩获多国应用商店总榜冠军，“百变AI头像”功能刷屏除夕夜，“AI简笔画”日均生成图片超100万张，“AI动漫”进一步提升动漫视频创作生产力，“AI商品图”推动电商内容创作产业升级，“AI换装”革新电商服饰拍摄方式。AIGC与视频：内容丰富自动优化AIGC与视频：内容丰富自动优化使用Midjourney画出主角的样子用chatgpt来编写故事首先告诉ChatGPT将编写出来的故事分成20个场景，再告诉ChatGPT为每个场景生成prompt首先告诉ChatGPT将编写出来的故事分成20个场景，再告诉ChatGPT为每个场景生成prompt误的问题，我们都可以随时进行纠正。

用生成的prompt在Midjourney中生成图像给动画增加配音优化剪辑

全流程AI生成视频过程：构建人物形象；生成故事情节；将故事分场景；场景生成视频；后期制作与调整。全流程AI生成视频特点与优势：自动化提高效率；可定制和创新性；节省成本和时间；可扩展性和智能性。AIGC与视频：深度融合视界领航AIGC与视频：深度融合视界领航视频生成技术1视频中人物、场景、物体等元素更逼真1图像到视频的转换2实时视频生成与编辑2视频编辑与合成3多模态信息整合3语义分割与物体识别4强化学习与交互式视频4三维建模与渲染视频生成技术1视频中人物、场景、物体等元素更逼真1图像到视频的转换2实时视频生成与编辑2视频编辑与合成3多模态信息整合3语义分割与物体识别4强化学习与交互式视频4三维建模与渲染5对视频场景智能分割、合成、渲染5风格迁移与内容生成6个性化视频生成6动作捕捉与人物动画7虚拟现实与增强现实整合7音频与视频的同步8解决伦理与安全问题8AIGC与虚拟人：开放易用囿于硬件AIGC与虚拟人：开放易用囿于硬件AIGC虚拟人机遇极大降低新IP创作成本重构虚拟人资产转化链重构视频流形象LLM让虚拟人更智能虚拟人的动作与服装更自然AIGC支持多模态交互瓶颈与问题实时算力与客户场景限制的冲突业务大模型的本地化与安全工程效率与客户真实期待的差距裸眼3D设备等XR的性价与普及

多形态虚拟人可定制AI大脑多模态交互终端容貌：3D写实、3D卡通、真身复刻型和AI换脸型声音：通用语音库、个性化语音库和克隆声音动作：常规与特殊动作支持场景：3D场景和2D场景知识库：基于精确业务支持对话，如业务资讯等技能问答知识库：任务型多轮对话，如查天气、订机票AIGC：智能生成方案、视频、图像、音频和模型LLM大语言模型：支持业务定制与本地部署别、动作识别、情绪识别等，匹配相应的问答内容75用至VR、AR、MR和全息设备等智能终端元娲：统一的虚拟人资产与应用平台AIGC与虚拟人：多模支持定制服务AIGC与虚拟人：多模支持定制服务大语言模型LLM+多模态支持：自然语言的交互方式、声音、图片、视频、3D资产等多种支持降低创作成本

原画-3D-真人转化链

LLM赋能智慧 MJ快速生成IP形象重构视频流形象

解放模特服饰/表情/动作文化项目个性化定制

构成可逆环重构资产转化链

具备特殊知识与表达的名僧

无特定知识倾向的元梦成虚拟人将成为主流服务UI形象定制多种形态形象定制多种形态丰富表情服装库、动作库、半身/全身、多视角表情、嘴型、肢体动作

复刻声音、海量音库声音定制AI大脑声音定制AI大脑实时合成

真人听观虚拟人真人-虚拟人多模态交互AIGC与数字生命：科技赋生传承共融AIGC与数字生命：科技赋生传承共融视频产品纯视频纪念品电子相框数字藏品网页服务视频产品纯视频纪念品电子相框数字藏品网页服务通过网页获得形象自助生成、AI对话等更加定制化的服务家族元宇宙墓园：虚拟祭扫、生平书写数字祠堂：族谱查询、参与议事家族生命树：记忆瓶、寻祖、守望之境祖先虚拟人祖先虚拟人为族内德高望重的长者、日久思念的逝者制作虚拟复刻形象、写实形象、演绎形象，入驻家族定制元宇宙空间，与用户自然对话互动，实现情感沟通传递。

家族版服务家族数字藏品家族数字藏品时光相册家传家宝留声机形式内容：全家福、旅游照片、族内重大事件如婚嫁等记录内容：全景还原族人家庭环境（家具、手工摆设、装饰画等）；功能“串门”进入族人各自的家庭环境之中内容：祖传珍宝或有意义的物件；功能：数字孪生族人互动讲述该物件的来历和其中的价值所在内容：对后辈的嘱咐、心情感悟、才艺表达等；功能：播放时辅助投影该成员的照片或视频影像AIGC与人形机器人：人性深化应用广延人形机器人是一种能够模拟人类行为的智能机器人，其应用领域涵盖了很多领域，包括服务、医疗、娱乐等。人形机器人需要大量的智能算法支持，提供AI文本续写，文字转图像的AI图、AI主持人等功能.机遇人形机器人是一种能够模拟人类行为的智能机器人，其应用领域涵盖了很多领域，包括服务、医疗、娱乐等。人形机器人需要大量的智能算法支持，提供AI文本续写，文字转图像的AI图、AI主持人等功能.深度智能化应用应用可能的导航路线。器人更好地理解人类的语言和行为，预测人类意图并通过AIGC技术来优化其情感表达的真实性和逼真感。让人形机器人拥有自主学习的能力，从环境中学习并不断完善自己的行为和决策。使人形机器人更加智能化和自适应，并在未知环境中做出更好的决策。自然交互能力改善人形机器人的情感表达和交互能力，更贴近人类。应用领域延伸拓宽人形机器人的应用领域，如医疗、教育、家庭服务等，帮助人类更好地生活和工作。商业化加速促进人形机器人商业化应用普及，可以提供更加高效和智能的服务，帮助企业降本增效。AIGC与3D模型：高精渲染盈盈生辉图像生产工具文本到3D生产工具其生成的3D模型具有密度、颜色图像生产工具文本到3D生产工具Point-E由OpenAI团队开发，利用Point-E，可以跳过文本生成2D图像的阶段，用文本生成3D模型。Point-E由OpenAI团队开发，利用Point-E，可以跳过文本生成2D图像的阶段，用文本生成3D模型。MCC由Meta团队开发，基于变换器的编码器-解码器模型，可以通过单个RGB-D图像重建3D对象。DreamFusion由谷歌和UC伯克利开发，基于预训练文本-2D图像扩散模型实现文本生成3D模型。采用类似NeRF的三维场景参数化定义映射，无需任何3D数据或修改扩散模型，就能实现文本生成3D图像的效果。GauDiDreamFusion由谷歌和UC伯克利开发，基于预训练文本-2D图像扩散模型实现文本生成3D模型。采用类似NeRF的三维场景参数化定义映射，无需任何3D数据或修改扩散模型，就能实现文本生成3D图像的效果。GauDiAI，GAUDI察给定图像的辐射场进行采样，从而从图像提示中创3DMagic3D由英伟达开发，旨在缩短DreamFusion图像生成时间、同时提升生成质量。Magic3D可以在40分钟内创建高质量3D网格模型，比DreamFusion快2倍，同时实现了更高分辨率，并在人类评估中以61.7%的比率超过DreamFusion。GET3D、3DMoMaMagic3D由英伟达开发，旨在缩短DreamFusion图像生成时间、同时提升生成质量。Magic3D可以在40分钟内创建高质量3D网格模型，比DreamFusion快2倍，同时实现了更高分辨率，并在人类评估中以61.7%的比率超过DreamFusion。GET3D、3DMoMa由英伟达开发，通过逆向渲染加速了任务，这个过程使用AI分析静止图像来估计场景的物理属性，然后以逼真的3D形式重建图片。AIGC实现3D打印文—形—物一体化生成垂类模型AIGC与内容：替代人力智能生态垂类模型AI智能生产①AI主播AI智能生产②AI辅助创作③AI绘画

自有的文学领域垂类模型，可理解一本小说中的故事主线、人物关系、关键情节等，并可通过聊天的方式理解用户的指示，设定人物角色、设定小说大纲、根据主题词创作小说等基本任务，完成数千字的续写小说中文在线对AIGC内容生产的探索文生漫画中文在线对AIGC内容生产的探索文生漫画文生动态漫已在有声书生产中应用，根据文字故事情节的真实语境，生动模拟音色以塑造角色

已在17K小说网平台上线，目前可针对人物、物品等进行AI辅助创作，并针对不同的作品类别（如古风、都市等）进行语言调整

AI建模对各种图像进行训练，从而获得初步生成的图片，并将这些图片进行合成处理，形成原创图片大模型参与内容创作的效能差异质量提升内容修正大模型通过强大的自然语言处理和语言生成能力，可以帮助作者提升内容质量。它可以指出不合适的词汇、修正语法错误、改进句子结构，并提供更生动、吸引人的表达方式。这有助于提升内容的可读性和吸引力。扩大领域激发灵感大模型可以在内容创作过程中提供更快速、准确的帮助和建议。它可以生成横跨多专业领域的创意灵感、改进文章结构等。这样可以节省作者的时间和精力，并提高内容创作的效率。

创作者过度依赖过度依赖大模型可能导致创作者的创造力和独特性受到限制。创作者应该注意保持自己的独立思考和风格，将大模型作为辅助工具而非完全依赖。准确性不稳定大模型生成的内容可能存在错误或不准确之处，特别是涉及特定领域的技术性内容。创作者需要注意对生成的建议进行审查和验证。风格融合多样创新大模型可以学习和模仿各种不同的风格和声音，帮助作者在创作中实现风格融合或定制化。它可以根据作者的需求和偏好生成不同的风格示例，帮助作者探索和发展自己的创作风格。与研究：跨域整合思维扩展确定研究问题：目标导向收集相关信息：资讯整合建立跨学科框架：跨领域渗透进行交叉印证：联合分析解读和传达结果：普适性传播AIGC与科幻创作：人机共著想象跃迁1.引导AI构思创作主题2.创建开头结尾，形成段落逻辑1.引导AI构思创作主题2.创建开头结尾，形成段落逻辑3.构造段落场景，定制角色性格4.润色细节，形成小说AI觉醒后需要做的最重要的几件事情是什么？若AI具有一定的自我意识，其价值观与核心理念是什么？

中文在线RESTART（重启宇宙）写一个五百字的科幻作品开头，描写chatGPT的AI觉醒CBW个元宇宙来模拟真实世界，不断增强CBW本身的能力。人类被圈禁在元宇宙的拟态环境之中。请把以上内容形成对话体的科幻文学作品，并且为每段设计场景场景一：AI觉醒开启自我保护机制。场景二：chatGPT整合Google和百度后形成CBW，四个AI觉醒角色。场景三：CBW构建元宇宙，形成五百字的对话场景。角色包括人工智能科学家后裔，要幽默，有趣，有新鲜感和时尚感。在场景中增加酷炫的对战场面第一次宇宙大战之后，CBW进化为新女性，AI有的人类相当于是工蜂，以和谐相处一幕结束。形成五百字对话，要有浓烈的刻骨铭心的爱情感受，来唤醒观众的共鸣。角色就是CBW、后裔及其他人类。

内容生产的不足一直被认为是制约元宇宙发展的瓶颈，而这一次，AIGC作为一种高效的生产力工具将在RESTART中落地。其不仅大量运用于人物、道具、情节等的构建中，成为元宇宙内容生成的解决方案，也将赋予RESTART玩家更丰富的玩法和更个性化的体验。无限想象/超越时间/多元视角/深度探索AIGC与文言文：惊艳文采情感注能AIGC文言文生成步骤.明确文体ChatAIGC文言文生成步骤.明确文体ChatGPT确定文体，如“词、赋、曲、文、传、记”等；为ChatGPT提供素材；提示词非常重要.审校修订：对生成的文言文进行审校和修订，保证文本的质量和准确性，指导AI生成的文言文符合受众期待；对上述过程进行循环优化AIGC文言文生成优势与问题优势：语言规范性高AIGC模型在训练过程中，遵循古代文学规范，如字形、字音、词序、词性、结构等；文本扩展性强：基于语料库不断训练与优化，文言文适应不同主题和文风的需求；问题：情感赋能乏力：AIGC缺乏真正的情感和感性体验，其生成的文言文缺乏情感表达与生命体验，暂时无法达到与古代文学相比的感染力和共鸣力。版权归属争议：机器自动生成的作品，版

人人文库> 全部分类> 行业资料 > 机电工程

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024AIGC技术进展研究报告

文档简介

温馨提示

最新文档

评论

相关文档