我们需要怎样的 AI 内容总结助手?
每天都有无数的信息涌现,我们的注意力很容易被吸引走,好像了解了很多,但认真回头去想,有价值的信息实在太少了。
人的注意力是有限的,如何利用好它们,尽可能获得高质量的信息一直是我思考的命题。除了主动订阅优质信源,还有一部分就要从各种推荐的信息流里,抽取对自己有帮助的信息。这也成为了我对信息消费的核心诉求。
为此,我开始体验和寻找当前市面上的AI工具,看哪个是可以满足我诉求的。
AI总结产品体验我挑选并使用了市面上几款AI总结类产品,同时也自己手动去构建了自己的AI总结bot,在这个过程中对自己的需求和当前的AI产品产生了一些思考。
现有产品体验通义智文最开始尝试体验的是通义智文,丢给它网页链接、PDF文件、专业论文、电子书,它都可以帮你总结。
当然它也有做得好的地方,比如它支持对阅读内容做笔记、支持翻译原文等,只是不是我需要的。
Podwise偶然看到了一款AI总结播客内容的产品让我眼前一亮,名字叫做Podwise。产品的slogan是也与我的理念不谋而合:Read,beforeListen.
它不仅支持找播客、订阅播客、文字转播客、内容摘要、关键词总结、精彩语录、分享到笔记软件等,最让我中意的是它可以直接用脑图总结播客内容,这个就非常清晰了。有了框架,我就可以对感兴趣的内容进行展开深入。
试用了产品之后,我觉得还是非常不错的,但是毕竟是有免费次数限制(每个月免费使用4次),于是我转向了国内的音频总结类产品,阿里的通义听悟。
通义听悟语音写成文字之后,内容更容易被索引,摄取效率也更高,我能够更容易地找到自己感兴趣的内容。
通义听悟使用下来不如预期,全文摘要、章节速览、发言总结这几个总结功能,结果都比较生硬。再者就是需要我主动再从文本中找信息,而不是将整理好的内容呈现给我。
我尤其不理解,这个通义智文和通义听悟,为什么都这么重视笔记功能,反而不好好做总结。想来想去只有一个原因,那就是底层模型还不够强,只能做些视觉层的功能来弥补模型的欠缺。想到这里我也释怀了,毕竟Podwise用的是GPT-4。
顺便吐槽一下,截至我写这篇内容时,通义智文、通义听悟、通义千问,直接整合为通义了。
Podwise给我的启发是,AI总结的内容可以通过更加结构化的方式表达出来,尤其是通过脑图的方式十分击中我,让我可以快速看清内容的结构信息。
由此再结合我的出发点,我的诉求变成了AI帮我总结内容并按照脑图的结构输出,或者Markdown结构输出。
Kimi后来等到Kimi出圈,我发现前面折腾的这些,Kimi都可以直接支持,而且表现相当出色。
它内容的详细程度可以按照自己的Prompt进行定义,当你想要就其中某个知识点展开了解时,可以直接和它继续对话,回答质量也不会太差。再次有了一种如获至宝的感觉。
Kimi的能力不仅仅是总结,联网搜索、翻译这些都处理得很不错,在内容总结这个场景下模型能力肉眼可见的比通义要强不少。
自己创造在不断的寻找和尝试过程中,我同时在想为什么不自己动手做一个AI应用?想想现在可以通过Prompt的方式快速做个AI产品出来还是很兴奋的,而不是必须会写代码做程序才行。
Kimi尽管Kimi本身就支持通过Prompt的方式实现我需要的功能,但是每次都现发指令去执行比较麻烦。
Kimi可以通过预设Prompt的方式,把常用的Prompt设置为常用语,一键呼出使用,十分贴心。想要大模型输出什么样的总结,不断去优化自己的Prompt即可。
CozeCoze支持用户快速、低门槛地搭建自己的Chatbot,并且可以将这些机器人一键发布到不同的平台进行应用。
我可以在这里选择底层的模型(免费使用GPT-4),输入自己的Prompt(AI可以帮助优化Prompt),然后选择对应的插件(AI可以帮助选择),基本就可以运转起来了。
如果有进一步的要求,可以引用自己的知识库数据,甚至可以通过关联多个bot搭建一个Agent完成一系列事项。通过预览查看总结的效果,不断调整Prompt来达到自己想要的效果。
我的bot叫做「阅读先锋」
可以免费使用GPT-4Turbo,再加上越来越丰富的插件系统,我打算后面多研究下Coze,搭建更加个性化的机器人出来,辅助阅读和学习。
使用感受总结AI总结的质量很难评,相同的内容在不同的模型上表现有差异,想知道哪个模型总结是相对高质量的(当然当前阶段对比下来明显还是GPT-4和Claude更强一些),必须自己先去阅读完原内容,再回头去看AI总结做对比才知道。
具体怎么评价总结效果,我最看重以下几个点:
内容不能偏离核心主题,不能大量遗漏;
输出的内容结构清晰,配合一些图表最好;
输出的文字可读性强,表述方式别太生硬。
另一方面,从Prompt构建的角度去看,步骤可以拆解为:
基于文字内容进行总结;
按照结构化要求进行输出。
上述的步骤,在执行层面存在两种实现方式:
使用大模型进行总结,总结效果取决于模型能力+自己的Prompt+自己的知识库+平台插件
如果是使用现成的AI产品进行总结,那其实是模型能力+别人的Prompt+现有的微调
思考与疑惑在折腾的过程中,尤其是使用AI总结的过程中,我愈发止不住思考:AI总结的内容是「准确」的吗?
每个人对内容的价值点判断是不一致的。相同的内容,可能AI认为重要、核心的内容,我并不在意。这样,如果我基于AI的总结结果去判断是否进行下一步阅读时,反而可能遗漏我认为重要的部分。
「准确」这个问题有点泛,可以进一步拆解为几个问题:
它总结的内容有遗漏或者重复吗?
它总结的内容是否存在偏见与误差?
它总结的内容与原文真正想表达一致吗?
开始怀疑之后,我又产生了几个相关问题:
从价值角度看,AI总结帮我提高了多少效率?真的提高了吗?
会不会反而让我舍弃了一些自主思考判断的机会?
以及;
我真的能放心把总结的任务交给它吗?
带着这些疑问,我开始慢慢寻找答案。在Twitter上看到了不同博主的观点,让我有从另一个视角的启发。原文如下:
我的结论我觉得自己还是需要一款AI内容总结工具的,只是需要区分内容去使用:
主体明确但内容比较长,或者是英文内容,先用AI去总结或翻译;
基于总结的框架,再去判断是否需要进一步精读;
精读的过程去探索更一手的信息,去主动思考,去记录笔记;
阅读完成之后,再整体人工总结一遍,吸收消化。
前两步,是让AI帮自己筛选过滤内容,然后进入主动阅读环节;后两步对优质内容进行学习思考。切勿太依赖AI工具什么都丢给它去阅读总结。记住自己的出发点:在信息洪流中,更好地聚焦与思考。
最后,不得不说,AI内容总结在当前阶段并不完美,但还是有它的价值,随着AI能力的提升,我相信这些问题大部分会得到解决。总有一天AI能切实帮到我们,让生活更加方便和智能。







