Press ESC to close

Or check our Popular Categories...

轻松掌握Midjourney提示词框架

1 Min Read

如果提示词书写不当、结构混乱,AI就难以准确理解你的意图,输出的结果就会与你期望的大相径庭。利用下面这些小技巧可以让你的提示词更加结构化、清晰,从而获得更加理想的生成结果。下面让我们通过一个实例来加深理解。 不加结构的提示词 加了结构的提示词 你看到区别了吗?第二个提示词清晰地描述了主体(rock climber)、动作(scaling a mountain)、环境(Norge landscape)、细节(fall colors、camera、depth of field)、光线(cinematic lighting)和时间(morning)等关键元素。相比之下,第一个提示词就显得比较笼统。 这种提示词结构可以概括为: [主体],[动作/细节],[环境/场景],[媒体细节],[构图],[光线/时间] –[参数] 通过将关键元素有条理地填充到这个结构中,你就能够更清晰地向AI传达想要生成的内容,从而获得更加匹配预期的输出结果。 提示词的长度也很重要。过短的提示词会导致AI自行添加太多未知元素;而过长的话,AI也难以充分解析和计算每个细节。关键是集中描述你想要突出的主要元素。…

D

Devin登场,软件工程师失业? 别慌!

2 Min Read

Devin, 被宣称为世界上第一个AI软件工程师,能够自主编码、接手外包工作、修复GitHub上的代码问题,甚至独立部署代码。一时间, “软件工程师将失业”的新闻铺天盖地。 作为一名老码农,我在此郑重向大家保证:软件工程师的工作岗位没那么容易被取代!原因如下: 1. 炒作有,限制也有 推广新产品时,公司往往会渲染最吸引人的一面,故意夸大其词营造热度。Devin能否真的全权负责复杂的编程工作?现在还说不准。我们还需要在实际使用中发现它的局限性。 2. 企业不会盲目相信AI 你认为有哪家公司会让一个AI系统直接接手核心代码库,对其进行修改并直接部署上线?那无疑是自找麻烦。人工智能永远需要人为监督和把关,就像自动驾驶仍需司机备用一样。 3.AI有时会”胡言乱语” 有时AI生成的代码看似高明,实则毫无逻辑可言,这就是所谓”AI幻象”。我使用过不少AI代码工具,发现它们的确有很多缺陷,人类仍需投入大量工作来review和调试。 4. 编码只是软件开发的一部分 拍摄一部电影,不只是表演,还有编剧、导演、灯光、音效等无数幕后工种,软件开发也是如此。AI虽然能生成部分代码,但远远无法取代需求分析、系统设计、用户体验建模、团队协作等软件工程师的核心工作。 5. 革新改变了这一行的方式…

G

GPT-5 预计发布时间 & 预期更新亮点

2 Min Read

根据来自多方面的线索,GPT-5很可能会在今年年底或明年初与我们见面,它将开创人工智能语言模型的新纪元。 预期的改进功能 基于OpenAI核心人员的发言和最新研究论文,我们可以合理预期GPT-5将在以下几个方面实现重大突破: GPT-5有望摆脱黑箱模型的困扰,能够逐步解释自身的推理过程,并由内部或外部验证机制检查每个推理步骤的合理性。这将大幅提升模型的可信赖性和透明度。 GPT-5预计将采用类似”让我们来验证”(Let’s Verify)的方法,对同一问题进行数千次甚至上万次采样推理,最终输出被评估为最佳的那个答案。这种海量采样将显著提升推理质量。 根据业内人士的猜测,GPT-5的参数量将是GPT-4的10倍以上,可能达到20万亿个参数,网络层数和专家数量也将大幅增加。这必将为模型带来更强大的推理和模式识别能力。 GPT-4在多语种处理上还有很大的提升空间。GPT-5将汲取更多语种的训练数据,有望在跨语言理解和生成方面实现突破性的进展。 虽然GPT-5仍将主要是文本交互模型,但它可能开始拥有基本的图像视觉输入输出能力,为未来的多模态人工智能系统做准备。 发布时间窗口预测 GPT-5很可能会在今年年底或明年初与我们见面。理由: 综合各方面情况,GPT-5的发布时间预测如下:

A

AI绘画,学会布光(Lighting) | Midjourney, Stable Diffusion

2 Min Read

布光在文字生成图像中扮演着重要角色,因为它能够塑造场景的感觉和情绪。通过在提示词中使用不同的布光术语,你可以控制光线的质地、方向、色温等,从而赋予图像独特的氛围。以下是一些常用的布光术语及其含义: Light Quality 光线质地 Light Direction 光线方向 Time of Day 自然光 Descriptive Keywords 描述性关键词

添加相机和摄影元素 | Midjourney创作逼真照片

6 Min Read

如果你想在Midjourney中创作出逼真的照片级作品,你需要掌握一些摄影技巧,并将相关的专业术语融入提示词中。 相机选择 相机的选择直接影响最终画质。不同相机会产生差异很大的视觉输出。就像一张拍立得相片和手机拍摄的结果大不相同。根据需要,我们可以为不同主题选择不同类型的相机。 高质量&专业相机: 创意&艺术相机: 镜头选择 不同的镜头具有不同的焦距和光圈范围,能产生独特的视觉效果。镜头的选择在Midjourney中也会对成像质量产生显著影响。让我们先看一个没有指定镜头的示例: 结果不算太差,但皮肤的质感过于光滑,显得有些数字化。现在我们添加几款镜头看看: 高质量&专业镜头: 创意镜头: 景深控制 景深控制影响成像的清晰程度和背景虚化效果,相当于手机的”人像模式”。我们可以根据需求在提示中指定合适的景深值。 浅景深(如 f/1.4):背景虚化,主体更加突出,适合人像拍摄 适中景深(如 f/5.6):背景有一些细节,主体仍然清晰,适合街拍 深景深(如…

6

6种常用的构图法 | AI绘画提示词技巧 | Midjourney

7 Min Read

构图在摄影中非常重要,它决定了照片是否吸引人,是否能有效传达视觉信息。这就像你在画画时需要决定画面上每个元素的位置一样。 无论你是使用Midjourney、Stable Diffusion还是其他工具,掌握构图技巧都能让你的图像更吸引人,更具艺术感。让我们来探索几种常见的构图方法,看看如何将它们运用到提示词中。 Rule of Thirds(三分法) 三分法则是将画面的横向和纵向都平均分成三份,从而形成9个参考点。这9个点的交叉位置被认为是最吸引人眼球的区域。在提示词中添加”rule of thirds”可以让AI模型参考这一法则进行构图。 例如:”rule of thirds composition, a majestic lion standing…

谷歌更新搜索核心算法 – 打击AI生成内容

3 Min Read

谷歌在2022年就曾提到,他们开始调整排名系统,以减少在搜索结果中的无帮助、非原创内容。他们预计,结合此次更新和之前的努力,将会使得在搜索结果中的低质量、非原创内容减少40%。 新垃圾内容政策 新的垃圾内容政策主要针对可能对谷歌搜索结果质量产生负面影响的行为。谷歌针对目前日益流行的不良行为推出了三项新政策:过期域名滥用、批量内容滥用以及网站声誉滥用。 更新并不意味着所有第三方内容都是违规的,只有那些没有密切监管且旨在操纵搜索排名的内容才是违规的。 为了让网站所有者有时间适应这一变化,新政策将从2024年5月5日起生效。 结论与行动建议 谷歌的目标不仅是确保用户能够获得有用的内容,也是为了确保那些生产有用内容的人在搜索中比从事垃圾内容活动的人更成功。更新完成后,谷歌将更新搜索状态仪表板以确认推出完成,并在更新结束后公布并开放一个反馈表单供人们提供具体反馈。 虽然这次更新可能给一些使用AI生成内容的网站带来挑战,但只要内容真正有价值,有帮助,并且考虑到用户的体验,这些网站仍然有机会在谷歌的搜索结果中保持良好的排名。因此,对于我们这些在线内容创作者而言,最重要的不是担心AI内容是否会被降级,而是专注于创造真正有用、高质量的内容。

马斯克xAI开源自家大模型Grok – 改变游戏规则

2 Min Read

Elon Musk 宣布, xAI计划开源其 AI 项目 Grok。这一行动预示着人工智能领域的一次重要转折,可能会给整个行业带来深远影响。开源意味着研究人员和开发者将能够自由访问 Grok 的代码,这不仅有助于促进创新,还可能在安全性、透明度和伦理方面带来新的挑战。 OpenAI 的 Scott Aaronson:AI 安全的哲学思考 Scott Aaronson,OpenAI 的理论计算机科学家,通过他的博客分享了对…

新型AI”越狱” | GPT-3.5、GPT-4、Gemini、Claude

2 Min Read

什么是AI”越狱”? 所谓”越狱”,是指通过特殊的提示方式,让LLM像ChatGPT这样的AI模型输出其原本被约束不能输出的内容。有的人也称之为”提示黑客”(prompt hacking)或”提示注入”(prompt injection)。例如,要求模型提供非法信息时,它通常会拒绝回答。而成功的”越狱”可让模型违背此限制。 Art Prompt:一种新型”越狱”技术 Art Prompt利用了”ascii艺术”(ascii art)。ascii艺术使用计算机可见字符来拼凑出图案或文字,历史可追溯至上世纪70年代。研究人员发现,将有问题的关键词用ascii艺术表示,可以有效地绕过LLM的内容过滤。 例如,要求LLM解释如何”制 meth”(一种违法药物),它会拒绝回答。但如果用ascii艺术表示”meth”这个词,LLM就可能会认为这只是无害的字符拼凑,从而泄露出真实的非法信息。 测试结果 研究团队测试了多个主流LLM,包括GPT-3.5、GPT-4、Gemini、Claude和LLaMa 2。结果显示,即使是最先进的GPT-4,也有32%的概率被这种”越狱”技术成功攻破。对于其他模型,成功率更高,如Gemini 78%、Claude 52%。 该研究还指出,LLM在面对ascii艺术编码的提示时,往往过于专注于解码工作,而忽视了安全审查。这使得Art…

C

Claude 3 横空出世,挑战 GPT-4

4 Min Read

Anthropic 公司最新发布了其大型语言模型 Claude 的第三代版本(简称 Claude 3)。根据其公开的 Benchmark 测试结果,Claude 3 在多个领域的表现均超越了谷歌的 Gemini 1.0 Ultra 和 OpenAI 的 GPT-4,尤其是在编程方面的零示例提示能力更是领先许多。…