AI科技评论

其他

3Cap 王康曼:我为什么投资 Cerebras Systems?

真的不好说。而历史上,每一个新的范式出现,之前的范式都会被拍死。我相信新的芯片范式也可能潜在颠覆人工智能算法。这个回复,我们可以十年回头看看对不对。但就目前的模型发展趋势来看,Transformer
8月13日 下午 4:29
其他

专访 OmniH2O 项目发起人何泰然:探索人形机器人遥操作通向具身智能的可行之路

最强的机器人模型一定不只有一种数据来源。作者丨饶舒玮编辑丨岑峰“既要又要”是何泰然的野心,也是决心。在谈到人形机器人遥操作的可行路径时,何泰然表示他既可以实现机器人的全身控制,还可以用强化学习来实现这一点。在他所探索的这条路上,不必因为技术瓶颈或短期目标而妥协,可以“既要又要”。遥操作,即远程操作(Teleoperation)。在机器人领域,人们通过某种设备操控机器人完成指令下的各种动作,从而收集机器人的训练数据,为后续自动化学习提供数据。因此,机器人遥控几乎是每一个机器人公司不可绕开的部分。尽管市场潜力无限,但在何泰然看来,目前领域依然囿于技术难关,并未得到长足的发展。而现在,具身智能的兴起,为这一领域带来一些新的生机。2015年前后,人工智能领域实现了从“感知智能”向“认知智能”研究范式的重大转变。ResNet、Transformer
6月28日 下午 8:32
其他

200 亿估值之后,中国大模型公司还能拿谁的钱?

的用户增长速度却给外界呈现了一种投放团队千军万马的态势。从投资人的角度看,月之暗面的融资目标非常清晰:国内的互联网大厂。「传统互联网人希望看到产品的用户增长与留存,不是很在乎短期收益,流量为王。现在
6月25日 下午 6:49
其他

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文

的精彩仍在继续。更多内容,点击下方关注:未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
6月20日 上午 1:26
其他

艾欧智能陈相羽:数据才是当下具身智能的痛点

PMF(产品市场契合点),智能化或是唯一出路。而具身智能则是实现机器人操作智能化并将机器人操作场景进行拓展最有潜力的路线。智能理解语义逻辑和任务规划是另一个挑战,即需要让机器人理解事件、动作和物体的
6月16日 下午 12:01
其他

AI 问前程:这样的分数高考志愿应该报哪所大学

选择困难症:尽力就行了,难道不选清华是因为自己不想?高考志愿填报,是每个学生人生中的第一次重大选择,也是一场令人倍感焦虑的“选择困难症”考验。面对众多的专业和院校,每一个选择都可能影响未来的方向。此时,心情就像站在十字路口,不知该往哪条路走。迷茫与不安交织,对未来的期望与现实的压力相互碰撞,既担心选择的专业不适合自己,又害怕错失理想院校的机会。这种复杂的情感,既充满期待又夹杂着无尽的担忧,让人倍感压力却又无法回避。往年,考生们只有老师、家长或者同学朋友可当作倾诉的对象,如今,我们尝试从理性数据中平复一下心情:问问AI
6月15日 下午 12:00
其他

AI 第一次高考:记得作文要龙头猪肚凤尾

随着人工智能技术的飞速发展,AI写作能力逐渐受到关注。高考作文作为衡量学生语言表达、思维逻辑和文化素养的重要标准,自然成为了各大人工智能模型测试和对比的理想题材。让不同的AI模型参与高考作文的写作,我们不仅可以检验它们在自然语言处理方面的能力,还能比较它们在内容创意、逻辑构建和语言运用等方面的表现。本篇文章将深入探讨各大AI模型在高考作文写作中的表现,以期揭示AI写作能力的现状和未来潜力。老师一再强调:“题好一半文,龙头配凤尾,猪肚有血肉,文采满篇飞”呀,同学们。AI
6月7日 下午 4:36
其他

《AI替我上班》底层策划篇 — “秒出PPT”

生成工具。能做到不厌恶自己工作的人有几个。每个时代有每个时代的民工。码农是民工,设计师页是民工,夸张点,所有在某宝和某同城上能接到单的工种,都是新时代民工。这样的群体有个特点:上下限拉得极开。1比如
6月3日 上午 10:13
其他

重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵

雷同,「不仅正确的地方一模一样,连错误的地方也一模一样」。至此,推特舆论开始发酵,「斯坦福抄袭中国大模型」一事不胫而走。1「套壳」证据实锤斯坦福团队百口莫辩最开始,用户质疑
6月3日 上午 10:13
其他

Wegic:收起你那根戳设计师屏幕的手指

Credits,根据目前的实测,每次生成一个网站会消耗40点,囊中羞涩。但这里替Wegic说一句,40点,一个网站,包括多个页面并且多次修改调整页面不另收费。由于这个测试使用
5月22日 下午 12:13
其他

一键生成,让文案不再难!—— 探索 Copydone 的神奇功能

文案创作。那么开始套娃:这样一款赛博降本增效神器该如何介绍自己呢?2正文:套娃以小红薯为例,进行标题党操作:输出结果:再懒一点,直接出成品:甚至可以一键
5月18日 下午 12:49
其他

Kimi+:还是那个让你别焦虑的 Kimi

2024年4月30日,Kimi推出了一系列新的聊天智能体,名为“Kimi+”。官方地址:https://kimi.moonshot.cn/kimiplus-square1Kimi+
5月16日 下午 12:00
其他

真人对话生成工具 D-ID:看看现在你做的假人有多真

生成时间约五分钟。如果氪金甚至可以去掉水印。本来也就打算试试之后关掉网页了,然后我看到了这个选项:啥?有方言?迅速整活:往北走走。下面开始正式介绍不露脸
5月16日 下午 12:00
自由知乎 自由微博
其他

五图乱哗:AI 生图横扫初级设计狮

AI文生图,即通过训练神经网络,使用AI自动生成高保真、高分辨乃至高度逼真的图像。因为一句话就能生图,因此被宠坏的用户逐渐开始恣意妄为。有想对着AI说一句话就让AI把所有工作做完的,也有把AI生成的内容抢注版权的,但说到底也是人类在不同的领域找捷径。1源于ChatGPT
4月24日 下午 5:01
其他

喜欢《漠河舞厅》就用天工把它创作成《漠河歌单》

2024年4月2日,天工发布AI写歌功能,名为“天工音乐”。通过自选歌曲让AI进行理解,再输入自创的歌词,可快速的创作同类风格的歌曲。目前该功能只能在iOS、Android端的最新版天工APP上才能使用,PC端及网页版暂时未开放该功能。功能易用性
4月4日 上午 10:10
其他

Suno AI 人人都能成为创作型歌手

V3生成的歌曲中存在但不影响歌曲播放。通过这个水印可以检测出歌曲是否有Suno创作从而保护版权。Suno目前在使用上有V2和V3两个版本支持,V3的能力明显更符合商业化。在实际使用Suno
3月27日 下午 5:31
其他

Kimi:来我们比比谁的一口气更长

2023年10月,月之暗面发布了Kimi,是彼时国产大模型的代表作之一,因20万字的输入并整理归纳的能力被很多以“实用为王”的支持者看好。而就在2024年3月18日,Kim公布了支持200万文字输入的内测邀请,测试者可使用Kimi获得200万字长度的无损阅读能力。回看2023年10月,相较于同时段前后发布的GPT-4-32k以及Claude
3月19日 下午 8:12
其他

比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出

比较,Unidiffuser效果是基本持平的。更重要是,Unidifuser扩展性更强,能基于一个底层模型完成图文之间的任意生成。生数团队的几位核心成员近几年于ICML、NeurIPS、ICLR
3月12日 下午 6:32
其他

Sora 发布两周后,关于 Sora 的一些冷思考

上搭建一套新的工具栏,「做皮不做瓤」,基于这样的模式去做工具运营,生产的内容也可以留存到自己的平台,如果这时候能有一个消费平台,就可以做出从生产到消费的自闭环。在这个过程中,技术虽然是属于
3月1日 下午 7:22
其他

自动驾驶领域,「决策」和「感知」终于握手言和

轨迹预测准确率提升30%的大模型「上车」之道。作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温,却呈现出愈发复杂而矛盾的现象。一方面,资本力量的积极投入,行业巨头纷纷抢占先机。例如,特斯拉近期推出了其“端到端”的全自动驾驶软件FSD
2月26日 下午 7:02
其他

字节携扣子全体同仁祝全国人民新年快乐

2024年2月1日,字节跳动正式推出“Coze
2月6日 下午 5:31
其他

独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元

Cohen。在博士期间,杨植麟用4年时间完成了一般6年才能完成的博士课程,并连续作为第一作者发表了两项关键研究成果——Transformer-XL和XLNet。Transformer-XL
2月3日 下午 12:01
其他

Pika 一键生成 3 秒视频,够做一个表情包

省流:Pika是一款文字生成视频的AI模型,可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。在2023年11月,Pika开放端口在Discord进行测试,而目前在其官网https://pika.art
1月8日 下午 6:24
其他

独家 | 原第四范式 VP 梁军成立 2B Agent 公司「纪元数科」

细分领域下的领导者产品象限。结合该公司股权信息及多方渠道确认,该公司最近进行完一轮股权架构变更,华业天成刚刚入股,占大约10%的股份。值得一提的是,与北京纪元数科这公司名紧密相关的纪元
1月3日 下午 5:18
其他

独家 | OneFlow 袁进辉再创业,成立新公司「硅基流动」

科技评论获悉,离开光年之外的袁进辉“再创业”又有新动向。2024年还没过去两天,一个名为“硅基流动”的公众号悄然上线,而这也是袁进辉在
1月2日 下午 10:51
其他

一手测评丨Midjourney V6 上线,现在绘图可以说人话了

V6此次将AI与人之间的交互感推上了一个新的高度,成品的逻辑性和质量也树立了新的里程碑,但目前还远远未达到可以正式产能投入。多人场景的复杂场景中容易出现不合逻辑比例可以看出Midjourney
2023年12月26日
其他

小冰无双

年十分领先、创新,得到了一众微软高层如王永东、陆奇的欣赏与支持。景鲲负责小冰的技术研发,一度在多轮对话的生成上碰壁,最后无奈找到了微软亚洲研究院的自然语言计算(NLC)组,希望两边能合作。当时
2023年11月29日
其他

从几天到几十秒,从繁杂操作到一条指令,AI 帮你征服 PPT

photos经过多轮测试,百度文库将PPT生成时间从天级缩短至秒级别。也就是说百度文库在一分钟之内就能完成打工人一天的工作量。对比一下,如果是手动制作一份
2023年9月27日
其他

DALL·E 3 推理能力炸裂提升,OpenAI 抢跑“ChatGPT 原生”

与早一期的版本也有极大的进步。提示词是“雾蒙蒙的森林里,地面非常泥泞,一场自行车比赛正在进行,一个粉红色的小丑骑着用奶酪做成的自行车,和跟熊猫击掌,熊猫很生气。”在
2023年9月21日
其他

《时代》周刊首次发布全球 AI 百大人物,李彦宏、李开复等人上榜

Landing.ai,担任公司的首席执行官。早在2012年,吴恩达向谷歌提出,建议谷歌使用大量的算力训练神经网络,那时很多人不理解这一建议,但吴恩达表示,“从那时起,自己便对
2023年9月8日
其他

独家 | 微软 AI 华人先驱黄学东正式宣布离职,将加入 Zoom 担任 CTO

Thacker等,黄学东是首位入选华人科学家。2020年,黄学东的微软生涯迎来巅峰:微软开始重视云计算与人工智能的结合,成立了
2023年6月9日
其他

对话京东何晓冬:「多模态大模型」涌现之前,要先回答三个问题

交换认知,互通有无。更多内容,点击下方关注:未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
2023年6月8日
其他

对话卫瓴杨炯纬:AI 大模型时代,怎么做好应用者?

应用者的回答,接入多元大模型,沉淀自家小模型。作者丨何思思编辑丨林觉民“卫瓴成立前夕,甚至公司和产品都不知道是什么时候就有了小微这个形象,”卫瓴科技创始人杨炯纬如是说。卫瓴成立于2020年,从时间来看,较国内其他主流CRM
2023年5月18日
其他

硅谷 NEC 关系图:将中国企业拽进 AI 时代的人

年春节前夕,李彦宏特地抽出时间,在北京接见了一位从硅谷飞来、在国内名不见经传的技术青年。这人三十来岁,戴着黑框眼镜,圆脸,个子不高,但口中所言句句都让李彦宏兴奋不已。这个人,就是时任硅谷NEC
2023年4月17日
其他

对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

作者丨何思思编辑丨林觉民走进融新科技中心A座23层,映入眼帘的是绿植、野营桌椅帐篷,在如此轻松的环境下,雷峰网见到了APUS创始人李涛,他着一身休闲装,显得尤为放松。对谈前,他用八个字总结了创办APUS的心路历程——“享受过程、追求快乐”,对谈过程中,也始终强调着“快乐”的重要性。一场对谈下来,他口中有关“创业压力、至暗时刻”的抱怨很少,更多的是应对变局时的从容淡定。雷峰网从侧面了解到,APUS在选择办公地址时通常首选高层,原因是窄小的格子间只会给程序员带来压迫感,毫无快乐可言,高楼层视野开阔,可以让程序员们员工心胸更宽广。站在APUS办公室的窗前能看到北京最高的建筑“中国尊”。李涛是国内最早一批接触到大模型的人之一,早在2019年,他就和字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷见了OpenAI创始人Sam
2023年4月7日
其他

独家 | AI 视觉大牛陶大程将卸任京东探索研究院院长

MMLab、是商汤科技创始人汤晓鸥的得意门生,2007年从英国博士毕业后曾先后任教于香港理工大学、新加坡南洋理工大学、澳大利亚悉尼科技大学等知名高校。2020年11月,京东成立京东探索研究院(JD
2023年3月24日
其他

独家 | AI 学术大会 IJCAI 2023 将改在中国澳门举办,三位中国学者任本地主席

2023/3/19更多内容,点击下方关注:未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
2023年3月19日
其他

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

大牛有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。就在半月前,亚马逊机器学习部门原杰出科学家/VP
2023年3月14日
其他

Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型

Scientist),从CMU重返工业界。所以,这次短暂的、并不算很成功的创业之旅就此终止,李沐也总结了一些教训和经验:团队和技术强是一方面,更重要的是要把产品做好。在这时,李沐收到了Jeff
2023年3月7日
其他

做大模型时代的「Linux」, ChatGPT 仅是开端

大模型只是中间状态,开源的大模型技术生态才是未来。作者
2023年3月3日
其他

解读 ChatGPT 背后的研究力量:90 后成主力军,大厂不再是顶尖 AI 人才第一选择

人才重新拉回了大众视野,重申纯粹科学研究的重要性,势必将掀起一轮新的人才争夺战。同时,也会提高大厂对大模型、计算资源等基础设施的重视,加快底层技术能力的追赶和补齐。正如前搜狗
2023年2月23日
其他

打造中国版 ChatGPT,国内有哪些学术力量能抢滩?

作画产品中脱颖而出的「盗梦师」(现改名为「造梦日记」),正是出自蓝振忠团队。蓝振忠本科从中山大学毕业,博士在卡内基梅隆大学就读,期间研究计算机视觉,后来去谷歌工作时转到自然语言处理方向,依托谷歌的
2023年2月20日
其他

用机器学习洞察兔年春节幸福感和疫情感知风险

2022年末的全国性新冠疫情和兔年春节接踵而至,为了深入理解新冠疫情和最新防疫政策对民众幸福感和日常生活的影响,深圳市人工智能与机器人研究院及香港中文大学(深圳)校长讲座教授贾建民、清华大学文科资深教授薛澜和博士生袁韵、香港大学副教授贾轼等组成的研究团队再次开展春节幸福感与新冠感染的全国性问卷调查,并应用可解释性机器学习模型(EBM,Explainable
2023年2月6日
其他

独家 | 李学龙、唐杰入选 2023 AAAI Fellow,华人占约 1/5

的谷歌学术被引用量已超过5.1万次。个人主页:https://scholar.google.co.jp/citations?user=PLJ0L4QAAAAJ&hl=zh-CN&oi=aoRisto
2023年1月25日
其他

看懂这25个核心概念,就没有啃不动的机器学习论文

陈彩娴机器学习领域的研究进展迅速,研究者既要及时跟进最新研究,也要不时地回顾经典。寒假开始,各位机器学习er在度假之余,想必也不会忘了自己卷王的身份。最近,Github上出现了一个名为“ML
2023年1月16日
其他

通向 AGI 之路:大型语言模型(LLM)技术精要

作者丨张俊林本文经授权转载自知乎:https://zhuanlan.zhihu.com/p/597586623?utm_campaign=shareopn&utm_medium=social&utm_oi=37478916423680&utm_psn=1595705313004679168&utm_source=wechat_timeline&s_r=0&wechatShare=1&utm_id=0ChatGPT出现后惊喜或惊醒了很多人。惊喜是因为没想到大型语言模型(LLM,Large
2023年1月10日
其他

高并发图数据库系统如何实现?

作者丨教授老边随着越来越多的开源软件、微服务架构的出现,所有的软件都在宣称自己是高性能的,大量的软件在滥用市场宣传混淆视听,把完全不具备高性能特征的系统鼓吹成无所不能,这让大众很难甄别出哪些是真材实料,哪些是狗皮膏药,哪些是滥竽充数。更有别有用心的厂家,打着符合国际、国内标准旗号的发布的颠倒黑白的性能评测报告——例如某互联网大厂与另外一家同城的图数据库创业公司就先后鼓吹自家的图数据库系统性能全球第一,但实际上所有测试结果都采用接口预先封装的模式,无论多复杂的查询逻辑,结果永远是几毫秒返回,既无查询语句,也没有查询结果的正确性验证,这就属于典型的盗名欺世。那么,有没有什么便捷的方式来甄别一款图数据库是真正具有较高的性能呢?提供以下锦囊要诀:是否采用原生图存储?是否采用原生图计算?是否采用原生图查询与优化器?是否支持高并发图查询、操作、分析、算法?关于前两点,我们用几个例子来直观的说明。以开源的图数据库项目JanusGraph为例,它就是用典型的外接第三方的存储引擎作为底层,但是在具体的图数据加载、查询与分析时效率非常低下。类似的Oracle
2023年1月4日
其他

ICLR 2022 | DBD: 基于分割后门训练过程的后门防御方法

香港中文大学(深圳)吴保元教授课题组和浙江大学秦湛教授课题组联合发表了一篇后门防御领域的文章,已顺利被ICLR2022接收。近年来,后门问题受到人们的广泛关注。随着后门攻击的不断提出,提出针对一般化后门攻击的防御方法变得愈加困难。该论文提出了一个基于分割后门训练过程的后门防御方法。本文揭示了后门攻击就是一个将后门投影到特征空间的端到端监督训练方法。在此基础上,本文分割训练过程来避免后门攻击。该方法与其他后门防御方法进行了对比实验,证明了该方法的有效性。收录会议:ICLR2022文章链接:https://arxiv.org/pdf/2202.03423.pdf代码链接:https://github.com/SCLBD/DBD1背景介绍后门攻击的目标是通过修改训练数据或者控制训练过程等方法使得模型预测正确干净样本,但是对于带有后门的样本判断为目标标签。例如,后门攻击者给图片增加固定位置的白块(即中毒图片)并且修改图片的标签为目标标签。用这些中毒数据训练模型过后,模型就会判断带有特定白块的图片为目标标签(如下图所示)。基本的后门攻击模型建立了触发器(trigger)和目标标签(target
2023年1月4日
其他

水下视觉智能研究迈不过的一道坎:涉水光学

Vicinage源于古法语/拉丁语的visnage/vicinus('neighbor'),
2022年12月26日