12、December展望 | 2023年十大科技趋势2023-12-035GeU2E7cAqZvfk2mogYEoA1低延迟、高通路的网络通信技术2下一代计算量子计算、专用集成芯片、硅基光电芯片等技术为代表的突破经典计算架构提供指数级算力增长的软硬件能力集合。3可信任科技旨在制定保障措施、增强隐私计算、构建可信任平台、管理工程风险从而获得内外部利益相关者的信任的系统。4绿色 清洁 可持续科技5超自动化是一种业务驱动的方法用于识别、审查和自动化尽可能多的业务流程、IT流程和算法流程等。它需要协调使用多种技术工具和平台包括机器人流程自动化(RPA)、自动机器学习 (AutoML) 、人工智能工程化 (AI Engineering)、低代码平台等。6人工智能等技术向实体领域深度融合7指数级智能AI大模型拥有超大规模参数、巨量训练数据通过模型的巨量化可以提高人工智能的通用属性并降低人工智能的应用门槛。8数实融生、泛在应用随着元宇宙消费级体感设备、 XR设备与应用开始兴起数字服务将打破虚实界限深度融合数字经济与实体经济。9人工智能生成内容AIGC10AI for Science 基础科学加速突破腾讯视频崩了2023-12-03-6HSPFra-Mpk7366zyuuuw前有阿里云大崩溃后有滴滴瘫痪12小时好在这次腾讯视频故障修复及时并没有出现长时间无法服务的问题。截止发文前某些功能已经恢复。网友笑称可能与各大互联网企业**“减猿增笑”**有关GPT-4没通过图灵测试60年前老AI击败了ChatGPT但人类胜率也仅有63%2023年12月03日9Sjs4ImrAHCgd2zZ9rEyMgGPT-4无法通过图灵测试UCSD团队研究证明60年前AI在测试中打败了ChatGPT更有趣的是人类在测试中的胜率仅有63%。上世纪60年代曾由麻省理工团队开发了史上第一个基于规则的聊天机器人ELIZA在这场测试中失败了。时间快进到现在「地表最强」ChatGPT不仅能作图、写代码还能胜任多种复杂任务无「LLM」能敌。然而ChatGPT却在最近一次测试中败给了这个有近60年历史的聊天机器人ELIZA。Jones C, Bergen B. Does GPT-4 pass the Turing test?[C]//Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers). 2024: 5183-5210.作者在认真研究了为什么测试者将ELIZA认定是人类的原因再次印证了一个结论图灵测试并不是一个判断AI智能高低的测试。R-CNN作者Ross Girshick离职何恺明、谢赛宁回归学界Meta CV走出了多少大神2023-12-04qif9_XuZbF1iXlkirJdZCw近日Meta 首席科学家 Yann LeCun 发推宣布Ross Girshick 将离开 FAIR加入艾伦人工智能研究所AI2。此前离职的还有 ResNeXt 一作谢赛宁加入纽约大学任助理教授、Georgia Gkioxari加入 Caltech 任助理教授等。其实加上今年 7 月底宣布回归学界将于 2024 年加入麻省理工学院MIT电气工程与计算机科学系 EECS 担任教职的何恺明FAIR 近年来已经走出了很多 CV 领域的大佬。今年Meta 发布了「分割一切」Segment Anything模型SAM被很多人誉为颠覆传统 CV 领域的研究Ross 是这篇论文的作者之一。硬核 | 从零制作一个激光雷达需要多久2023-12-133JSlnenMcmDxFYtPSAZtOQUP 主用了大半年的业余时间用一个激光测距传感器整出了一个单线机械旋转式激光雷达总共包括硬件设计、结构设计、FPGA 开发和 3D 打印几个步骤。PyTorch下的可视化工具网络结构/训练过程可视化2023-12-15oU19ptYqE5fUDC7rk4DMywpip install hiddenlayerpip install torchviztensorboardXvisdomFacebook为pytorch开发的一块可视化工具除了Yolo的其他选择轻量级检测网络层出不穷框架解析及部署实践2023-12-15ly7wRKEe1bjGdVYt2pZfSAhttps://github.com/RangiLyu/nanodet最强Pose模型RTMO开源 | 9MB9ms性能完爆YOLO-Pose2023-12-15Y2UxqGsG9LWr0LN6ZUExpAhttps://github.com/open-mmlab/mmpose/tree/dev-1.x/projects/rtmoTransformer简化版来了网友年度经典应用2023-12-16VJM64ircESQMnhftP-XAOwhttps://arxiv.org/pdf/2311.01906.pdf移除了残差连接Skip Connections / Residual Connections移除或极简化了多头注意力MHA中的关键权重矩阵——移除 Value (V) 和 Projection § 矩阵或将其合并/固定为恒等映射。将串行子块改为并行子块Parallel Sub-blocks移除了归一化层Normalization Layers收益训练吞吐量提升 15%~16% 移除了残差、LN 等频繁读写内存的操作并采用了并行子块结构使得硬件GPU/TPU的训练计算效率大大提升。参数量减少 15%P 矩阵MultiHead(Q,K,V)Concat(Head1,Head2,…,Headh)P\text{MultiHead}(Q, K, V) \text{Concat}(\text{Head}_1, \text{Head}_2, \dots, \text{Head}_h) \mathbf{P}MultiHead(Q,K,V)Concat(Head1,Head2,…,Headh)P在标准 Transformer 架构中PPP矩阵输出投影矩阵存在的意义绝对不仅是“调整维度”它承担着信息融合、打破空间隔离、以及增强表达能力的核心多维作用跨头的信息融合Cross-Head Communication作者发现如果我们在架构中完全去掉VVV和PPP退化为纯QKQKQK注意力同时依靠并行子块结构并精心设计初始化的信号放大系数后面紧跟的 FFN前馈网络其实完全有能力顺便把多头信息融合的工作给做了。汤晓鸥那个将港中文建成计算机视觉黄埔军校的人永远地离开了…2023-12-17WQTuwnT7k6n08amB5mpaqQ2001年创立了香港中文大学多媒体实验室2005年至2007年在微软亚洲研究院工作担任视觉计算组主任MMLab的今天能有此成就、乃至港中文能代表中国在全球计算机视觉领域叱咤风云离不开汤晓鸥对人才的重视。香港中文大学多媒体实验室Multimedia Laboratory, The Chinese University of Hong KongMMLab由香港中文大学信息工程学系主任汤晓鸥教授于2001年7月创建是最早应用深度学习进行计算机视觉研究的华人团队被誉为计算机视觉界的黄埔军校。汤晓鸥选题就两个标准一个是开辟一个新方向另一个是结束一个方向。世界上又少了一个有趣的灵魂2023-12-171ajEtLPHbHqAyKkA3wuMuw尽管“Black Sheep”的英文释义不尽正面但汤晓鸥曾解释说他想强调的是一种特立独行、不陷入“羊群跟随效应”的意味。自动帮你完成物体检测标注这个工具你必须了解一下2023-12-182Pj8ArOasAbDHFIh18XQfghttps://github.com/AlvaroCavalcante/auto_annotate模型和带标签的速度都是自己提供的。。。国内AI大模型已近80个哪个最有前途2023-12-18kldRKV8uDrN4uYNcpSatgg从近100篇综述出发一览自动驾驶的技术发展路线2023-12-24BNtkT9v1iMFSmbmcAXm1wQ为什么图像处理如此困难2023-12-24RomyOsdxDtwgHuNG3SlvHw数据量大固有的信息丢失图像处理的本质是从3D世界如果我们处理视频流中的数据则是4D投影到2D平面即平面图像上获取信息伴随噪音理解图像含义困难当我们观看图像时我们会用累积的学习和记忆称为先验知识来分析它。奥特曼年终17条总结爆火OpenAI总裁违反直觉但真实2023-12-24VVNVAOK89PYLz5dxKJh9Gg乐观、执着、自信、原始驱动力和人际关系是一切的开始。有凝聚力的团队、冷静与紧迫感的恰当结合以及对目标的超预期承诺是完成任务的关键。长期规划往往被忽视不必担心他人在短期内的看法随着时间的推移会逐渐好起来。对于团队来说完成一件真正重要的难事比做一件无关紧要的易事更容易大胆的想法能够激发斗志。激励机制是超能力要谨慎设定。将资源集中在少数你深信不疑的事上这话说起来容易但做起来难。你能排除掉的东西比你想象的要多。言简意赅地交流沟通。每当遇到废话和官僚主义都要坚决反对并鼓励他人也这样做。不要让组织架构妨碍人们高效协同工作。结果才是最重要的不要让好的过程成为坏结果的借口。花更多时间招聘。敢于选择那些进步飞速的高潜力人才。除智力外还要寻找他们完成任务的证据。超级明星比你想象的更有价值但必须根据他们对组织的真正影响来评估他们。快速迭代可以解决很多问题一般情况下如果你能迅速做出调整犯错是可以接受的。计划应该以十年为单位来制定执行则应该以周来衡量。不要挑战商业世界的基本法则。灵感易逝生命短暂。不行动是一种特别隐蔽的风险。规模经常会带来出人意料的新特性。复利指数很神奇。特别是你真的想建立一个通过规模获得复利优势的企业。跌倒了就爬起来继续前进。与优秀的人共事是人生最美好的体验之一。OCR终结了旷视提出支持文档级OCR的多模态大模型支持中英文已开源2023-12-257YBH3LQSrU-wV4XYY2N6EQ马斯克“超级高铁”梦碎美国明星创业公司公告倒闭成立10年一单没接2023-12-25gJdDrcwFK4W2w1nnze7lQg谷歌被曝或再次大裁员3万员工面临被AI取代2023年12月25日8CJXvSNnYiOIoRUE1h4xyQ今年1月谷歌母公司Alphabet宣布将在全球裁员12000人相当于其全球员工总数的6%。继年初的1.2万大裁员之后谷歌又被曝出将重组广告销售部门AI自动化工具使3万员工面临裁员风险。Sam Altman突遭起底「生活奢靡」戴340万名表开上亿豪车买价值6亿豪宅2023年12月25日Kcv_uRYnvird6CBqZPS-3Q对此网友表示显然财富对数logwealth是存在的——想要让金钱带来的幸福感翻一倍就需要将你的财富增加十倍。从100万美元涨到1000万美元能彻底改变一个人的生活而从1000万美元增加到2000万美元其实只会让人感到稍微满意一些。Business Insider此前报道称据美国国税局的文件显示作为OpenAI的首席执行官他的年薪只有58,333美元而且他在公司的股权非常少。不过他在9年内投资了400多家公司设计商业飞行、大脑植入等不同领域。每逢低谷都有硅谷大佬救场在Sam Altman被OpenAI董事会解雇的几分钟后他给自己的亿万富翁朋友、Airbnb CEO Brian Chesky发了短信——「太残酷了」。随后当天晚些时候Chesky告诉OpenAI最大合作伙伴微软的CEO纳德拉「Sam得到了整个硅谷的支持。」只用了一个周末Altman就成功召集了硅谷一些最有影响力的CEO和投资者包括OpenAI的第一位风险投资人、Sun Microsystems的联合创始人Vinod Khosla谷歌和Facebook的早期投资者Ron Conway以及微软CEO纳德拉。几天后Altman顺利回到OpenAI再次担任CEO。闭门会里大佬们都好敢说2023-12-26FjXhayQ4FBRvvx10pdbtLQ高文院士用一个坐标系做了解释如果将认知划分为四个象限其中第一象限是“我知道我知道什么”这是最好的象限第四象限是“我不知道我知道什么”这就是当下大模型所处的象限也是它为什么会出现幻觉。上海人工智能实验室主任助理王延峰引用比尔·盖茨的观点肯定了这种趋势我们永远会高估一个新技术前5年的创造性我们永远会低估一个技术接下来5年的破坏性。中国石油大学北京人工智能学院创院院长肖立志教授直言大模型会颠覆油气领域但不会那么快到来。打造「专属arXiv」德国高校顶级视觉团队推出「论文定制化」推荐系统免费开放2023-12-26A-hLpeyVFnkcrEpE6p3ewQarXiv每天论文太多看不过来Scholar Inbox是一款免费定制化个人论文推荐网站每天将最新论文按照与您的研究兴趣匹配程度进行排序并推送到您邮箱。http://www.scholar-inbox.com/期待雷布斯小米汽车首场发布会定了2023年12月27日yFty1mCxWP90v3mE6I-e3A小米汽车12月28日举行技术发布会从2021年3月30日时值小米春季发布会小米发布公告官宣开始造车到今天正好1000天。深入浅出拆解AIGC的基础及各行业应用推荐阅读2023年12月28日gDizZAOg2hN2wi4hYz1llQ文本类、图像类、音频类、视频类2023启示录丨自动驾驶这一年2023年12月28日glot08TzVm9qpqKSXIwv3Q抢时间抢数量如同共享单车大战的时候OFO和摩拜单车每天凌晨就拉着自家的单车在各大地铁口提前占位一样。城市辅助驾驶的落地也开始以城市为节点悄然画出了一条无形的战线。辅助驾驶很早就知道让用户用起来完成商业逻辑闭环的重要性这就像是一种PTSD(创伤后应激障碍它不断地告诉智能驾驶必须落地必须尽快落地。要加速智能驾驶落地L2关键的要素有两个一个是降本“轻地图重感知”的呼声越来越高另一个是安全国内即使最激进的纯视觉方案也会搭载至少一颗激光雷达作为安全冗余。Cruise就像是班上成绩一直名列前茅的孩子当他交出的答卷都一塌糊涂的时候打击的一定不只是他自己还有大家对这个班级整体的信心。L4大模型在自动驾驶的应用主要体现在两个维度其一是大模型作为工具辅助自动驾驶算法的训练其二是大模型作为决策模型控制车辆的行驶提高自动驾驶的泛化能力特斯拉FSD V12版本减少了数十万行代码并且在没有数据连接的情况下仍能在不熟悉的地形上工作。从智能驾驶到自动驾驶从大模型到车路协同再到产业政策。自动泊车之停车位检测算法2023年12月29日_jZ8LP6tFVfjOjF5hjYO5A4幅鱼眼相机拍摄的画面会经过Around View Monitor(AVM)处理生成一个拼接后的鸟瞰图网上公开的数据集可用同济的ps2.0首尔的PIL_park这两个数据集可以用来练兵再去应对现实场景。传统视觉的车位检测、深度时代的车位检测华为的车BU拆解意味着什么2023年12月30日q6Jy-EqGqgbZN1qAU1wkbg华为和小鹏汽车关于真假AEB的争论掀起行业广泛关注特斯拉开始向员工提供FSD V12自动驾驶系统国内汽车企业开始了新一轮的联盟关系华为和长安成立合资公司其中华为将智能汽车解决方案业务的核心技术和资源进行整合至合资公司其中涉及到汽车智能驾驶解决方案、汽车智能座舱、智能汽车数字平台、智能车云、AR-HUD与智能车灯业务。揭秘茅台背后的科技力量看传统企业的数字化转型与升级2023年12月31日l8CjQbc94FLKKI7B_kbGVQ酱香拿铁、茅台冰淇淋、巧克力、“首发即登顶”的i茅台、巽风元宇宙App“得微生物者得天下”你觉得茅台酒好喝一定不是你的错觉是真的有科学道理在里头。在人才投入上茅台还成立了科学与技术研究院设立了酿造原料与育种研究中心、酿造环境生态研究中心、绿色技术研究中心、酿造微生物研究中心、风味与安全研究中心、酿造工艺与装备技术研究中心、生命科学策源中心等七个研发中心。实体经济和传统产业的科技机遇。科技创新最大的机遇和想象空间在茅台在实体经济在有场景的产业。前缀https://mp.weixin.qq.com/s/
【Reading Notes】(6.12)Favorite Articles from 2023 December
12、December展望 | 2023年十大科技趋势2023-12-035GeU2E7cAqZvfk2mogYEoA1低延迟、高通路的网络通信技术2下一代计算量子计算、专用集成芯片、硅基光电芯片等技术为代表的突破经典计算架构提供指数级算力增长的软硬件能力集合。3可信任科技旨在制定保障措施、增强隐私计算、构建可信任平台、管理工程风险从而获得内外部利益相关者的信任的系统。4绿色 清洁 可持续科技5超自动化是一种业务驱动的方法用于识别、审查和自动化尽可能多的业务流程、IT流程和算法流程等。它需要协调使用多种技术工具和平台包括机器人流程自动化(RPA)、自动机器学习 (AutoML) 、人工智能工程化 (AI Engineering)、低代码平台等。6人工智能等技术向实体领域深度融合7指数级智能AI大模型拥有超大规模参数、巨量训练数据通过模型的巨量化可以提高人工智能的通用属性并降低人工智能的应用门槛。8数实融生、泛在应用随着元宇宙消费级体感设备、 XR设备与应用开始兴起数字服务将打破虚实界限深度融合数字经济与实体经济。9人工智能生成内容AIGC10AI for Science 基础科学加速突破腾讯视频崩了2023-12-03-6HSPFra-Mpk7366zyuuuw前有阿里云大崩溃后有滴滴瘫痪12小时好在这次腾讯视频故障修复及时并没有出现长时间无法服务的问题。截止发文前某些功能已经恢复。网友笑称可能与各大互联网企业**“减猿增笑”**有关GPT-4没通过图灵测试60年前老AI击败了ChatGPT但人类胜率也仅有63%2023年12月03日9Sjs4ImrAHCgd2zZ9rEyMgGPT-4无法通过图灵测试UCSD团队研究证明60年前AI在测试中打败了ChatGPT更有趣的是人类在测试中的胜率仅有63%。上世纪60年代曾由麻省理工团队开发了史上第一个基于规则的聊天机器人ELIZA在这场测试中失败了。时间快进到现在「地表最强」ChatGPT不仅能作图、写代码还能胜任多种复杂任务无「LLM」能敌。然而ChatGPT却在最近一次测试中败给了这个有近60年历史的聊天机器人ELIZA。Jones C, Bergen B. Does GPT-4 pass the Turing test?[C]//Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers). 2024: 5183-5210.作者在认真研究了为什么测试者将ELIZA认定是人类的原因再次印证了一个结论图灵测试并不是一个判断AI智能高低的测试。R-CNN作者Ross Girshick离职何恺明、谢赛宁回归学界Meta CV走出了多少大神2023-12-04qif9_XuZbF1iXlkirJdZCw近日Meta 首席科学家 Yann LeCun 发推宣布Ross Girshick 将离开 FAIR加入艾伦人工智能研究所AI2。此前离职的还有 ResNeXt 一作谢赛宁加入纽约大学任助理教授、Georgia Gkioxari加入 Caltech 任助理教授等。其实加上今年 7 月底宣布回归学界将于 2024 年加入麻省理工学院MIT电气工程与计算机科学系 EECS 担任教职的何恺明FAIR 近年来已经走出了很多 CV 领域的大佬。今年Meta 发布了「分割一切」Segment Anything模型SAM被很多人誉为颠覆传统 CV 领域的研究Ross 是这篇论文的作者之一。硬核 | 从零制作一个激光雷达需要多久2023-12-133JSlnenMcmDxFYtPSAZtOQUP 主用了大半年的业余时间用一个激光测距传感器整出了一个单线机械旋转式激光雷达总共包括硬件设计、结构设计、FPGA 开发和 3D 打印几个步骤。PyTorch下的可视化工具网络结构/训练过程可视化2023-12-15oU19ptYqE5fUDC7rk4DMywpip install hiddenlayerpip install torchviztensorboardXvisdomFacebook为pytorch开发的一块可视化工具除了Yolo的其他选择轻量级检测网络层出不穷框架解析及部署实践2023-12-15ly7wRKEe1bjGdVYt2pZfSAhttps://github.com/RangiLyu/nanodet最强Pose模型RTMO开源 | 9MB9ms性能完爆YOLO-Pose2023-12-15Y2UxqGsG9LWr0LN6ZUExpAhttps://github.com/open-mmlab/mmpose/tree/dev-1.x/projects/rtmoTransformer简化版来了网友年度经典应用2023-12-16VJM64ircESQMnhftP-XAOwhttps://arxiv.org/pdf/2311.01906.pdf移除了残差连接Skip Connections / Residual Connections移除或极简化了多头注意力MHA中的关键权重矩阵——移除 Value (V) 和 Projection § 矩阵或将其合并/固定为恒等映射。将串行子块改为并行子块Parallel Sub-blocks移除了归一化层Normalization Layers收益训练吞吐量提升 15%~16% 移除了残差、LN 等频繁读写内存的操作并采用了并行子块结构使得硬件GPU/TPU的训练计算效率大大提升。参数量减少 15%P 矩阵MultiHead(Q,K,V)Concat(Head1,Head2,…,Headh)P\text{MultiHead}(Q, K, V) \text{Concat}(\text{Head}_1, \text{Head}_2, \dots, \text{Head}_h) \mathbf{P}MultiHead(Q,K,V)Concat(Head1,Head2,…,Headh)P在标准 Transformer 架构中PPP矩阵输出投影矩阵存在的意义绝对不仅是“调整维度”它承担着信息融合、打破空间隔离、以及增强表达能力的核心多维作用跨头的信息融合Cross-Head Communication作者发现如果我们在架构中完全去掉VVV和PPP退化为纯QKQKQK注意力同时依靠并行子块结构并精心设计初始化的信号放大系数后面紧跟的 FFN前馈网络其实完全有能力顺便把多头信息融合的工作给做了。汤晓鸥那个将港中文建成计算机视觉黄埔军校的人永远地离开了…2023-12-17WQTuwnT7k6n08amB5mpaqQ2001年创立了香港中文大学多媒体实验室2005年至2007年在微软亚洲研究院工作担任视觉计算组主任MMLab的今天能有此成就、乃至港中文能代表中国在全球计算机视觉领域叱咤风云离不开汤晓鸥对人才的重视。香港中文大学多媒体实验室Multimedia Laboratory, The Chinese University of Hong KongMMLab由香港中文大学信息工程学系主任汤晓鸥教授于2001年7月创建是最早应用深度学习进行计算机视觉研究的华人团队被誉为计算机视觉界的黄埔军校。汤晓鸥选题就两个标准一个是开辟一个新方向另一个是结束一个方向。世界上又少了一个有趣的灵魂2023-12-171ajEtLPHbHqAyKkA3wuMuw尽管“Black Sheep”的英文释义不尽正面但汤晓鸥曾解释说他想强调的是一种特立独行、不陷入“羊群跟随效应”的意味。自动帮你完成物体检测标注这个工具你必须了解一下2023-12-182Pj8ArOasAbDHFIh18XQfghttps://github.com/AlvaroCavalcante/auto_annotate模型和带标签的速度都是自己提供的。。。国内AI大模型已近80个哪个最有前途2023-12-18kldRKV8uDrN4uYNcpSatgg从近100篇综述出发一览自动驾驶的技术发展路线2023-12-24BNtkT9v1iMFSmbmcAXm1wQ为什么图像处理如此困难2023-12-24RomyOsdxDtwgHuNG3SlvHw数据量大固有的信息丢失图像处理的本质是从3D世界如果我们处理视频流中的数据则是4D投影到2D平面即平面图像上获取信息伴随噪音理解图像含义困难当我们观看图像时我们会用累积的学习和记忆称为先验知识来分析它。奥特曼年终17条总结爆火OpenAI总裁违反直觉但真实2023-12-24VVNVAOK89PYLz5dxKJh9Gg乐观、执着、自信、原始驱动力和人际关系是一切的开始。有凝聚力的团队、冷静与紧迫感的恰当结合以及对目标的超预期承诺是完成任务的关键。长期规划往往被忽视不必担心他人在短期内的看法随着时间的推移会逐渐好起来。对于团队来说完成一件真正重要的难事比做一件无关紧要的易事更容易大胆的想法能够激发斗志。激励机制是超能力要谨慎设定。将资源集中在少数你深信不疑的事上这话说起来容易但做起来难。你能排除掉的东西比你想象的要多。言简意赅地交流沟通。每当遇到废话和官僚主义都要坚决反对并鼓励他人也这样做。不要让组织架构妨碍人们高效协同工作。结果才是最重要的不要让好的过程成为坏结果的借口。花更多时间招聘。敢于选择那些进步飞速的高潜力人才。除智力外还要寻找他们完成任务的证据。超级明星比你想象的更有价值但必须根据他们对组织的真正影响来评估他们。快速迭代可以解决很多问题一般情况下如果你能迅速做出调整犯错是可以接受的。计划应该以十年为单位来制定执行则应该以周来衡量。不要挑战商业世界的基本法则。灵感易逝生命短暂。不行动是一种特别隐蔽的风险。规模经常会带来出人意料的新特性。复利指数很神奇。特别是你真的想建立一个通过规模获得复利优势的企业。跌倒了就爬起来继续前进。与优秀的人共事是人生最美好的体验之一。OCR终结了旷视提出支持文档级OCR的多模态大模型支持中英文已开源2023-12-257YBH3LQSrU-wV4XYY2N6EQ马斯克“超级高铁”梦碎美国明星创业公司公告倒闭成立10年一单没接2023-12-25gJdDrcwFK4W2w1nnze7lQg谷歌被曝或再次大裁员3万员工面临被AI取代2023年12月25日8CJXvSNnYiOIoRUE1h4xyQ今年1月谷歌母公司Alphabet宣布将在全球裁员12000人相当于其全球员工总数的6%。继年初的1.2万大裁员之后谷歌又被曝出将重组广告销售部门AI自动化工具使3万员工面临裁员风险。Sam Altman突遭起底「生活奢靡」戴340万名表开上亿豪车买价值6亿豪宅2023年12月25日Kcv_uRYnvird6CBqZPS-3Q对此网友表示显然财富对数logwealth是存在的——想要让金钱带来的幸福感翻一倍就需要将你的财富增加十倍。从100万美元涨到1000万美元能彻底改变一个人的生活而从1000万美元增加到2000万美元其实只会让人感到稍微满意一些。Business Insider此前报道称据美国国税局的文件显示作为OpenAI的首席执行官他的年薪只有58,333美元而且他在公司的股权非常少。不过他在9年内投资了400多家公司设计商业飞行、大脑植入等不同领域。每逢低谷都有硅谷大佬救场在Sam Altman被OpenAI董事会解雇的几分钟后他给自己的亿万富翁朋友、Airbnb CEO Brian Chesky发了短信——「太残酷了」。随后当天晚些时候Chesky告诉OpenAI最大合作伙伴微软的CEO纳德拉「Sam得到了整个硅谷的支持。」只用了一个周末Altman就成功召集了硅谷一些最有影响力的CEO和投资者包括OpenAI的第一位风险投资人、Sun Microsystems的联合创始人Vinod Khosla谷歌和Facebook的早期投资者Ron Conway以及微软CEO纳德拉。几天后Altman顺利回到OpenAI再次担任CEO。闭门会里大佬们都好敢说2023-12-26FjXhayQ4FBRvvx10pdbtLQ高文院士用一个坐标系做了解释如果将认知划分为四个象限其中第一象限是“我知道我知道什么”这是最好的象限第四象限是“我不知道我知道什么”这就是当下大模型所处的象限也是它为什么会出现幻觉。上海人工智能实验室主任助理王延峰引用比尔·盖茨的观点肯定了这种趋势我们永远会高估一个新技术前5年的创造性我们永远会低估一个技术接下来5年的破坏性。中国石油大学北京人工智能学院创院院长肖立志教授直言大模型会颠覆油气领域但不会那么快到来。打造「专属arXiv」德国高校顶级视觉团队推出「论文定制化」推荐系统免费开放2023-12-26A-hLpeyVFnkcrEpE6p3ewQarXiv每天论文太多看不过来Scholar Inbox是一款免费定制化个人论文推荐网站每天将最新论文按照与您的研究兴趣匹配程度进行排序并推送到您邮箱。http://www.scholar-inbox.com/期待雷布斯小米汽车首场发布会定了2023年12月27日yFty1mCxWP90v3mE6I-e3A小米汽车12月28日举行技术发布会从2021年3月30日时值小米春季发布会小米发布公告官宣开始造车到今天正好1000天。深入浅出拆解AIGC的基础及各行业应用推荐阅读2023年12月28日gDizZAOg2hN2wi4hYz1llQ文本类、图像类、音频类、视频类2023启示录丨自动驾驶这一年2023年12月28日glot08TzVm9qpqKSXIwv3Q抢时间抢数量如同共享单车大战的时候OFO和摩拜单车每天凌晨就拉着自家的单车在各大地铁口提前占位一样。城市辅助驾驶的落地也开始以城市为节点悄然画出了一条无形的战线。辅助驾驶很早就知道让用户用起来完成商业逻辑闭环的重要性这就像是一种PTSD(创伤后应激障碍它不断地告诉智能驾驶必须落地必须尽快落地。要加速智能驾驶落地L2关键的要素有两个一个是降本“轻地图重感知”的呼声越来越高另一个是安全国内即使最激进的纯视觉方案也会搭载至少一颗激光雷达作为安全冗余。Cruise就像是班上成绩一直名列前茅的孩子当他交出的答卷都一塌糊涂的时候打击的一定不只是他自己还有大家对这个班级整体的信心。L4大模型在自动驾驶的应用主要体现在两个维度其一是大模型作为工具辅助自动驾驶算法的训练其二是大模型作为决策模型控制车辆的行驶提高自动驾驶的泛化能力特斯拉FSD V12版本减少了数十万行代码并且在没有数据连接的情况下仍能在不熟悉的地形上工作。从智能驾驶到自动驾驶从大模型到车路协同再到产业政策。自动泊车之停车位检测算法2023年12月29日_jZ8LP6tFVfjOjF5hjYO5A4幅鱼眼相机拍摄的画面会经过Around View Monitor(AVM)处理生成一个拼接后的鸟瞰图网上公开的数据集可用同济的ps2.0首尔的PIL_park这两个数据集可以用来练兵再去应对现实场景。传统视觉的车位检测、深度时代的车位检测华为的车BU拆解意味着什么2023年12月30日q6Jy-EqGqgbZN1qAU1wkbg华为和小鹏汽车关于真假AEB的争论掀起行业广泛关注特斯拉开始向员工提供FSD V12自动驾驶系统国内汽车企业开始了新一轮的联盟关系华为和长安成立合资公司其中华为将智能汽车解决方案业务的核心技术和资源进行整合至合资公司其中涉及到汽车智能驾驶解决方案、汽车智能座舱、智能汽车数字平台、智能车云、AR-HUD与智能车灯业务。揭秘茅台背后的科技力量看传统企业的数字化转型与升级2023年12月31日l8CjQbc94FLKKI7B_kbGVQ酱香拿铁、茅台冰淇淋、巧克力、“首发即登顶”的i茅台、巽风元宇宙App“得微生物者得天下”你觉得茅台酒好喝一定不是你的错觉是真的有科学道理在里头。在人才投入上茅台还成立了科学与技术研究院设立了酿造原料与育种研究中心、酿造环境生态研究中心、绿色技术研究中心、酿造微生物研究中心、风味与安全研究中心、酿造工艺与装备技术研究中心、生命科学策源中心等七个研发中心。实体经济和传统产业的科技机遇。科技创新最大的机遇和想象空间在茅台在实体经济在有场景的产业。前缀https://mp.weixin.qq.com/s/