跳至主要内容

产品随想 | 周刊 第82期:Let's think step by step

Products

  • VideoChat with MOSS https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS
    VideoChat is a multifunctional video question answering tool that combines the functions of Action Recognition, Visual Captioning and StableLM. Our solution generates dense, descriptive captions for any object and action in a video, offering a range of language styles to suit different user preferences. It supports users to have conversations in different lengths, emotions, authenticity of language.
    让AI看懂视频,适用长视频场景,决策是否值得投入时间看

  • ChatGLM-6B https://github.com/THUDM/ChatGLM-6B
    ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型
    还有130B,它最強的點,倒是底層的跨GPU平臺運行的能力(當然,情感上我個人還是傾向於歐美GPU,當然Fuck Nvidia是需要堅持的)
    GLM-130B:开源的双语预训练模型:https://keg.cs.tsinghua.edu.cn/glm-130b/zh/posts/glm-130b/
    Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University
    在消費級別PC上能RUN,是個必然的趨勢,期待

  • MiniGPT-4 https://github.com/Vision-CAIR/MiniGPT-4
    Enhancing Vision-language Understanding with Advanced Large Language Models
    增強視覺理解,官方的一個Demo是根據視頻中的圖片,描述出對應的文本信息
    MiniGPT-4 可以生成準確的圖像描述,根據圖像編寫文本,為圖片描述的問題提供解決方案,甚至可以根據照片教用戶如何做某些事情。 (也就是GPT-4在Demo中呈現過的能力)

  • gpt4free https://github.com/xtekky/gpt4free
    收到OpenAI律師函的項目,必然有可取之處

  • GPT-3 Demo https://gpt3demo.com/map
    Real-time Market Map
    基於GPT能力在應用層做嘗試的APP們

  • Advancing AGI for humanity https://thegenerality.com/agi/blog.html
    裏面的論文值得讀讀

  • ControlNet https://github.com/lllyasviel/ControlNet
    ControlNet is a neural network structure to control diffusion models by adding extra conditions.
    可以將這個技術理解成是illustrator中的錨點

  • TaskMatrix https://github.com/microsoft/TaskMatrix
    TaskMatrix connects ChatGPT and a series of Visual Foundation Models to enable sending and receiving images during chatting.
    與多模態LLM有本質上的差別

Ideas

  • 智慧信息的压缩:模型智能的涌现之道 https://mp.weixin.qq.com/s/hQmvltuMlClBonM6UJmtLg
    OpenAI 不需要 langchain:
    从传统产业链逻辑来说,OpenAI 提供基础模型能力,langchain 提供开发工具,这原本是没有太大冲突的,但是从获取更多含有人类智慧数据目标的角度,langchain 的存在会让“开发者是如何构建某种应用”这样一份极具价值的“有效数据”脱离 OpenAI 的控制范围。
    ——這裏非常有insight,值得關注
    “对于以 AGI 为目标的 OpenAI 来说,所有的应用似乎只是下一阶段 AGI 能力的“有效数据”的免费提供者。”
    這個邏輯在世界層面上,會造就模型集中,寡頭,在中國,可能也會聚攏到1-2家

  • 投身LLM,要从本质上想明白的三个问题 https://zhuanlan.zhihu.com/p/618902095
    牢記表層的知識、事實,會最先被淘汰、替換,最深層的思考認知,纔是最關鍵、不可替換的

  • Compression for AGI https://mp.weixin.qq.com/s/G613tUo4TzjddaysGs26AQ
    找到解决感知问题的最小描述长度
    這個思路和張小龍做微信的思路,也很一致,即找到原子化的組件,讓組件去流動、流通,核心思路也是找到解決問題的最小化、最優雅的方案

  • 解读 ChatGPT 背后的技术重点:RLHF、IFT、CoT、红蓝对抗 https://zhuanlan.zhihu.com/p/602458131

  • Toolformer: Language Models Can Teach Themselves to Use Tools https://arxiv.org/abs/2302.04761
    里程碑式的能力
    https://kikaben.com/toolformer-2023/ 這篇文章,配合Yann LeCun的Twitter,對Toolformer的理解能更深
    “The limits of my language means the limits of my world. ” ——
    Despite this, one still needs to approximate closer and closer to the truth through probabilistic truth. The representations of language are inherently wrong but it is very useful, it enables humans to convey propositions of the world and gain a deeper understanding and interaction with reality. This ability enables us to gain insight into the nature of consciousness and the human condition, an experience that is uniquely human.
    突然開始理解,當年Silas拼命讓我們寫好Leads的原因.....因爲寫那些Description的過程,就是讓自己對世界產生更深認知的過程

  • OpenAI正式推出多模态GPT-4 https://mp.weixin.qq.com/s/iw0wESsyP8nkPuFkj_EkOg
    当任务的复杂性达到足够的阈值时,区别就出来了,GPT-4比GPT-3.5更可靠,更有创造力,能够处理更细微的指令。
    开源OpenAI Evals,用于创建和运行评估GPT-4等模型的基准,同时逐个样本检查其性能。

 

Popular posts from 产品随想的博客

产品随想 | 陪读《乔布斯传》:1-17章

乔布斯经典照片集 坐在麗莎電腦旁。他說:「毕加索曾說:「好的藝術家懂得模仿,佛大的藝術家善於偷取。」因此,窃取偉大的點子沒有什麼好羞耻的。 與蓋茲在電話中達成協議:「比爾,謝謝你支持蘋果。因為你的支持,世界將變得更美好。」 1997年蘋果在波士頓舉行的麥金塔世界大會,蓋茲透過衛星連線在巨大的螢幕上出現。質伯斯說:「我真是笨死了,竟然讓蓋兹以這種方式現身。他讓我看起來好沙小。」 ──时刻自省 前言 The people who are crazy enough to think they can change the world are the ones who do. 只有那些瘋狂到以為自己可以改變世界的人, 才能改變這個世界。 這麼些年來,賈伯斯說起話來的認真與專注態度,著實打動不少人。我們一直保持連絡,即使在他被逐出蘋果之後,我們還有來往。每次他有新產品要推出時,像 NeXT 電腦或皮克斯 (Pixar)的電影,他就會來找我。他常帶我去曼哈頓下城一家壽司店用餐,講起他的產品,渾身散發出光和熱,眉飛色舞的說這是他登峰造極之作。我喜歡這個人。 ──对自己产品深深的爱 他的堅持教我疑惑。人人都知道賈伯斯不道餘力捍衛隱私, 而且我不知道他是否看過我寫的任何一本傳記。我還是不敢立刻答應,只說或許再等等。然而到了 2009年,我接到他太太蘿琳. 鮑威爾打來的電話。她直截了當說:「如果你還想為史帝夫寫傳,最好趕快動筆。」這是他第二次因病向公司請長假。我坦言他早在2004 年得知自己罹患胰臟癌的時候就曾主動邀我寫傳,但我當時對他罹癌的事一無所知。蘿琳解釋說,他們盡量保密,因此當時根本沒幾個人知道。他是在動手術的前夕打電話給我的。 ──和Make Something Wonderful对照起来看 他還說,自從他回到蘋果重新掌權,這十二年來是他創造新產品的高峰期,但他還有更重要的目標,也就是效法惠普的惠立和普克(David Packard),締造一家創新動力無限的公司,進而超越惠普。 ──苹果公司才是乔布斯最得意的产品 他說:「我一直認為,自己是個偏向人文的孩子,但我也喜歡電子的東西。後來,我讀到寶麗來(Polaroid)創辦人蘭德 (Edwin Land)曾說過,一個人能站在人文和科學的交會口,兼容贯通,才是真正的人才。在那當下,我决定要當這樣的人。」他似乎在暗示我,這可以做為傳...

产品随想 | 周刊 第63期:中国城市化的历史思考

Products 李志 · BB   https://github.com/turkyden/lizhi-app 开箱即用,一个珍藏了李志音乐作品集的在线播放器 作者的描述很有意思:我们不能失去信仰~ Watt Toolkit 🧰 (原名 Steam++)   https://github.com/BeyondDimension/SteamTools 「Watt Toolkit」是一个开源跨平台的多功能游戏工具箱,此工具的大部分功能都是需要您下载安装 Steam 才能使用。 语雀为什么没被钉钉吃掉,跟支付宝又是什么关系?   https://www.xiaoyuzhoufm.com/episode/62ed2b1d226f5c1fa0d58357 乱翻书播客推荐 Behind the Curtain   https://www.quiverquant.com/sources/behind-the-curtain/ 我们正在结合我们一直在收集的关于公司游说、国会股票交易和拟议立法的数据,以便让您跟踪华盛顿特区幕后发生的事情您可以使用此工具查看哪些法案正在被国会审议了哪些上市公司正在就这些法案进行游说,以及哪些国会议员交易了这些公司的股票。 民主非常需要这样的信息透明 脑洞大开,给自行车装上倒车雷达和行车记录仪   https://sspai.com/post/73521 佳明-骑行雷达尾灯 Varia RCT 715,非常喜欢,但真的好贵.....3K+ RMB Health 体检报告出现高尿酸,你该如何在饮食方面控制风险?   https://sspai.com/post/73031 Citizenship Consciousness & Privacy 张鸣:中国城市化的历史思考 2019 09 04   https://www.youtube.com/watch?v=rRcPssCkXeI 内核论点是:城市化最重要的有私有产权的商人 这个创作者也值得关注 Run 日本移居指南   https://guoyu.mirror.xyz/bPaDKAcrhJGUbaXu9BWDcdD-F46gBFATTvf_qwZ9Bso 添加加Run模块,润 A Programmer's Guid...

Steve Jobs at 44, By Michael Krantz, 1999

Differences and Similarities Between Apple and Pixar Apple turns out many products--a dozen a year; if you count all the minor ones, probably a hundred. Pixar is striving to turn out one a year. But the converse of that is that Pixar's products will still be used fifty years from now, whereas I don't think you'll be using any product Apple brings to market this year fifty years from now. Pixar is making art for the ages. Kids will be watching Toy Story in the future. And Apple is much more of a constant race to continually improve things and stay ahead of the competition.  His Role At Pixar At Pixar my job is to help build the studio and recruit people and help create a situation where they can do the best work of their lives. And to some degree it's the same at Apple. But at Pixar, I don't direct the movies, whereas at Apple probably, if I had to pick a role out of a film production, I'd be the director. So it...

一些建筑类书刊

这是我在知乎上的一个回答,之前看到一个说法,就是越厉害的人不仅仅是吸收知识,即输入,同时也会最大化的输出,输出的方式我认为有很多,写书,写博客等等,我选择的输出方式是在知乎,豆瓣留下自己的足迹,博客是我的大本营,在这里mark一下我在知乎一个关于建筑书籍的回答

Linux私房菜-14章 Linux帐号管理

1.认识三个文件夹 '/etc/passwd' '/etc/shadow' '/etc/group' 2.Mac更改Terminal shell: chsh -s /bin/bash 3.权限更改的一种姿势: chmod u+x file    user group others 4.一般帐号密码忘记:root身份passwd即可    root帐号密码忘记:重启进入用户维护模式再以 passwd命令更改密码,或Live CD开机挂载根目录再修改/etc/shadow,将root密码字段清空,重启后root将不再需要密码 5.有效用户组与初始用户组认识  groups命令查看当前登录用户支持的用户组

产品随想 | 周刊 第85期:e-Residency与数字游民

  David Shambaugh   https://www.google.com/search?q=David+Shambaugh 中国问题研究专家,著作极多 郭玉闪   https://zh.wikipedia.org/wiki/郭玉闪?useskin=vector 中国公共知识分子 我只想好好观影   github.com/BetterWorld-Liuser/autoMovies 刘煜辉:中国资本市场灵魂出窍 最有活力的公司几乎不在A股   https://finance.sina.com.cn/stock/marketresearch/2017-06-23/doc-ifyhmtek7705574.shtml 回看17年的专家讲话,还是挺有水平的,挺多都认可 纽约文化沙龙   https://www.youtube.com/@user-cu2hl5tf6y/videos 视频质量出奇的高,推荐 透视中国政治by吴国光、程晓农 备忘下,貌似评价挺好的一本书 CAPI China Chair Wu Guoguang (吴国光 / 吳國光)   https://www.youtube.com/playlist?list=PLIt1szHhnm_Hso3jGUbfGpnEAbsPOuEVV 因为热爱中国,我们越要看懂中国 AI Canon   https://a16z.com/2023/05/25/ai-canon/ in this post, we’re sharing a curated list of resources we’ve relied on to get smarter about modern AI. We call it the “AI Canon” because these papers, blog posts, courses, and guides have had an outsized impact on the field over the past several years. 希望中国的投資機構,也能有更多的分享與輸出,提升整個社會的認知 Cantonese Font 粵語字體   https://visual-fonts.com/zh/...

产品爱好者周刊 第36期:走进Linux

Products OpenShot   https://github.com/OpenShot/openshot-qt OpenShot Video Editor is an award-winning free and open-source video editor for Linux, Mac, and Windows 开源的视频剪辑工具,跨平台 Run   https://github.com/The-Run-Philosophy-Organization/run 润学全球官方指定GITHUB,整理润学宗旨、纲领、理论和各类润之实例 Dozer   https://github.com/Mortennn/Dozer Hide menu bar icons on macOS ThisIsWin11   https://github.com/builtbybel/ThisIsWin11 Win11的隐私保护 RoundedTB   https://github.com/torchgm/RoundedTB Add margins, rounded corners and segments to your taskbars! Droptop Four   https://github.com/Droptop-Four/Basic-Version Droptop Four is the fourth iteration of the popular dropdown app launcher for Windows & Rainmeter. LibreTube   https://github.com/Libre-tube/LibreTube An alternative frontend for YouTube, for Android. nheko   https://github.com/Nheko-Reborn/nheko Quaternion   https://github.com/quotient-im/Quaternion 多平台的Matrix客户端 FluffyChat   https://fluffychat.im/ Phone端的Matrix...

关于建筑实习的经验贴

慢慢整理实习的帖子,如果近期太阳能竞赛不占用太多时间的话,可以开始准备实习了 一.  给自己的问题   1. 你的设计风格是什么   2. 实习的目的 二. 事务所推荐   1. 墨臣,住宅(商业地产)做的很棒,项目管理做的比较好,但是相对来说公建项目比较少       如果希望接触多种类型项目的话考虑一下,多多了解这个事务所,赖军   2. 标准营造,张珂,重视方案设计的惊喜把控,重视图解,还有手工模型   3. 大舍,不浮夸,有自己的设计理念,效率高,唯一不加班公司 三. 学院派建筑师   1. 何镜堂事务所,缺点是周期长,待遇不高,风格单一,设计类型单一   2.  直向(新史家小学,方法上典型霍尔的风格,董功是霍尔弟子)       TAO迹(腾冲的那个博物馆不错)       山水秀(祝晓峰的风格很小清新,朱家角的房子)       业余       家琨(在符合本时代的建筑材料的运用上很有造诣,再生砖,鹿野苑....)       非常(张永和,作品说不出来有多好,但是又总觉得很精妙,二分宅) 四. 设计院   1. 商业建筑设计公司实习推荐  CCDI,DC,UA   2.  大连院,东北院,华东院,中建北京院   3. 不推荐同济院,因为挂靠的小公司很多,鱼龙混杂 五. 先锋派建筑师   1. UNStudio,项目比扎哈的脚踏实地而且思考深度高很多   2. BIG,设计的起源都是一个平淡朴实但是又很精妙的理由   3. 蓝天组   4. 国内事务所推荐  李虎(霍尔的合伙人)的open,侯梁(貌似的是玛雅,不知道用rhino和       GH),徐东昕,徐甜甜的DNA,徐卫国(感觉这老爷子在国内参数化设计界可以呼风唤       雨了)   5. 不推...

零碎思考 | 關於LLM的閱讀筆記

  通向AGI之路:大型语言模型(LLM)技术精要   https://zhuanlan.zhihu.com/p/597586623 拆解追溯 GPT-3.5 各项能力的起源   https://yaofu.notion.site/GPT-3-5-360081d91ec245f29029d37b54573756 清晰明瞭 A Closer Look at Large Language Models Emergent Abilities   https://yaofu.notion.site/A-Closer-Look-at-Large-Language-Models-Emergent-Abilities-493876b55df5479d80686f68a1abd72f 試圖說明LLM的涌現能力] 如何利用GPT-4打造高效智能信息收集神器   https://lpcv.org/fwc/a/MzU0MDk3NTUxMA==/2247483868/1 學習思路 GPT-4编码教程,如何用AI构建和宣传我的Midjourney网站增强插件   https://op7418.zhubai.love/posts/2254193381183922176 AUTOMATIC1111 GUI: A Beginner’s Guide   https://stable-diffusion-art.com/automatic1111/ 其實就是AI界的雲渲染,挺有意思的 Midjourney还是Stable Diffusion: 你应该选哪个?   https://zhuanlan.zhihu.com/p/617157677 看到作者下方的“註冊會計師”,中國太卷了 树莓派4B刷OpenWrt做路由器的经验+踩坑   https://zhuanlan.zhihu.com/p/451788328 關注其中的坑點 doc.openwrt.cc   https://doc.openwrt.cc/

Interview with Steve Jobs, WGBH, 1990

Interviewer: what is it about this machine? Why is this machine so interesting? Why has it been so influential? Jobs: Ah ahm, I'll give you my point of view on it. I remember reading a magazine article a long time ago ah when I was ah twelve years ago maybe, in I think it was Scientific American . I'm not sure. And the article ahm proposed to measure the efficiency of locomotion for ah lots of species on planet earth to see which species was the most efficient at getting from point A to point B. Ah and they measured the kilocalories that each one expended. So ah they ranked them all and I remember that ahm...ah the Condor, Condor was the most efficient at [CLEARS THROAT] getting from point A to point B. And humankind, the crown of creation came in with a rather unimpressive showing about a third of the way down...