知识图谱的梳理
前言:
本文为思考知识图谱的产品功能草稿,有留档记录知道自己当时的思路,便于将来回顾使用。
思考的方式:
这个事情为什么要做?有什么价值?
一切的价值起点,都应当是这个产品的立足之本。
极客时间是一个学习平台,要解决用户 不知道该学什么、不知道为什么而学、不知道怎么学、不知道如何高效地学、不知道学得怎么样。
IT 领域可能受大环境影响,但「学习」这件事永远是基本的价值锚点。
现在主流的知识形态是什么样的?
- 专栏形式
- 视频课形式
- 实验场形式
专栏课的问题:
- 不够系统
- 不够开放
调研现在市面上所有 IT 学习类平台的状态:
- 各大专门的 IT 学习平台 (慕课网、CSDN、51CTO、掘金、黑马程序员、实验楼……)
- 阿里社区教程、其他社区
现在的课程有哪些类型?分别适用于哪些场景?
以某一个技术组件为主题的知识
以某一个场景为主题的知识
以某一个职业技能要求为主题的知识
现在的知识形态解决不了什么问题?
我们需要一套更贴近学习本质的知识组织形式
学习的过程,是记忆知识点,并且形成知识点的关联。从记忆的角度,有如下方法能加强记忆过程: ① 创造认知失调 ② 知识结构符合认知结构 ③ 重复 ④ 多维度输入 ⑤ 总结 ⑥ 检索 。所以,为了加强学习的效果和效率,我们会采取很多方法,以下为一些常用方法:
- 拆解知识结构,按照 总分、时间、逻辑 等结构排布知识
- 提问先行,回答问题的过程来学习
- 学习分级,从全貌到细节
- 使用图、视频、音频、实操 等多种输入方式
- 使用测验、翻转课堂等方式
知识的传递形态,可以成为 课程,主流的课程类型可以分为如下:
- 以文本为主的形态,如 专栏、书籍
- 以音频为主的形态,如 音频课
- 以视频为主的形态,如 视频课
- 以实践为主的形态,如 实验课、项目实操课
不同的课程形态,适用于不同类型的知识,以及适用于不同类型的学习者。
文本形态的课程,对于知识类型的适应性最广,一般结合 文字、图形 就能解释几乎所有的知识类型,这也是为什么文本形态流传最广 (比如书籍);同时,文本形态的课程所具备的知识密度可以非常高,由于文本具备前后知识关联的特性,一句话可以传递的信息量可以非常丰富。
传统的文本类型课程主要有 专栏 和 书籍 两类,从知识的组织形态上,大多采用 部分-章-节-段 的格式,是一种根据特定知识的内在特征组织起来的一维树形结构,从抽象模式上来看,大都可以拆解成 鱼骨图
,每一根鱼骨就是一部分知识的内在逻辑的表示。
这种一维结构特征,非常适合传统的纸质载体,因此也成为最常用的组织形态。
但这种结构也有其弊端,因为知识本身的特征是网状的,每一个知识节点所关联的其他节点数量非常多,但上述的这种一维结构无法表示出这种内在联系,因此,在学习这种结构的内容时,学习者的 类比、迁移 等能力往往发挥不出来,就容易从 “多维输入” 降为 “单维输入”,知识的关联效率更低,也就极大地限制了学习的效率。
随着技术发展,传统以纸质为知识载体 的方式逐渐成为过去式,而以 web 为知识载体的方式逐渐成为主体,这让解决上述的弊端成为了可能。
知识的内在特征就是相互关联的,在不同的抽象维度上形成一个巨大的网络。这既是知识的内在特征,也是人学习知识的内在要求。学习,就是一个在大脑中 记忆具体知识 和 记忆知识关联 的过程。因此,最好的课程组织方式,就是课程本身就是网状结构,这样能让学习课程的过程 以最流畅的、不需要额外处理关联的 方式进行。
当然,知识是无限连贯的,但课程本身是具有边界的,因此,课程可以看做是一个特定主题的知识聚合。构建一个课程的过程,就是圈定知识范围的过程,当范围确定后,一个课程就相当于是这个网络中的一个切面,这个切面本身是二维平面结构。
制作一个课程的过程,就是根据特定的主题和目的,构建这样一个二维结构。
那么,如何去表示知识的关联性呢? (待进一步思考和探索)
学习都是有内在动机的,人们会去学习一门技术知识,常规的入口有三种: 以问题场景为导向的学习、以组件为导向的学习、以职业发展为导向的学习。
问题导向,例如 如何实现高并发系统? 如何实现秒杀系统? 如何用 redis 实现分布式锁? 等等
组件/专题 导向,例如 MySQL实战45讲、Dubbo源码剖析与实战、设计模式之美 等等
职业发展 导向,例如 重学前端、初级 Go 工程师训练营、xxx学习路径 等等
对于一门简单的知识,一个专栏可能就能描述得清楚。 对于一门复杂的知识,一门专栏就无法很好地描述清楚,甚至一本书也无法很好地描述清楚。
复杂知识往往可以划分成多个部分,单个部分有时候可以独立成册,一门课程按照自己的逻辑主线进行知识组织,同时把自己非重点的部分作为 扩展知识 链接到外部。
以 Redis 为例,我们可以把 redis 划分成这些模块:
- redis 的入门
- redis 的协议
- redis 持久化
- redis 的实践案例
- redis 各数据结构的实现
- redis 集群
- redis 运维
- 其他 redis 的生态
我们对 redis 本身会有一些标签,例如: 内存数据库、数据库、kv数据库、缓存、高性能、高可靠、分片集群、主从复制、codis 等等。
这些标签,本身可以做更详细的解释,也可以仅仅是内容的聚合。
例如,在 内存数据库
这个标签中,会有专门对内存数据库的介绍内容 (根据主体重要性,也可以没有介绍)。
商业价值视角
一个互联网产品,核心是提供用户价值,作为平台,需要协调平台的各方,优化场景,实现多赢。
一个 C 端的产品,需要提供用户价值,这既是获取用户的基础,也是盈利的基础。
流量的来源可以有很多,常见的思考方式如:
- 发展的人群 (基础到高级)
- 最新的领域
- 社交平台 (例如 大V推荐、自培养IP、社区活动、其他内容平台截流……)
- 搜索引擎 (例如 免费内容)
- 工具属性
- 其他 (例如 资源交换、友商互推、同平台互推等等)
- 口碑
用户终究需要一些理由进入一个产品,也需要一些理由留在一个产品,这两个环节被叫做 增长 和 留存。
口碑传播是 最便宜 也是 最持久 的增长方式,口碑的来源有很多,上面的每一个环节做得好,都可以是 口碑传播 的因素。 PLG 就是对这个点最好的解释。
极客时间,主体作为一个 技术学习平台,核心是解决 IT 用户的学习问题。学习遇到的主要问题有: ① 不知道要学什么 ② 不知道为什么要学 ③ 不知道学习的效果怎么样 ④ 学习效率不高 ⑤ 学习动力不强
学习者学习东西的动力入口:
- 遇到 xxxx 问题,我该怎么办?
- 我想要 xxxx,我能怎么办?
- xxxx 是什么?
感觉得到了一个重要认知:
单一模块知识学习已死,学习平台的下一个竞争场,在于 系统性 和 多维度。
一个服务于学习的平台,需要紧跟用户学习需求,从 内容、课程形态、服务方式、所需工具 等等角度去升级。
一个平台的理念,决定了它会走向何方,否则就像黑夜中没有灯塔的船只,随波逐流,不知归处。
深入理解用户需求、深入理解市场竞争格局、深入理解自身资源,这才是做好一个产品的基础条件啊。
目前可以对学习者进行分类,不同学习者的需求不同,【这里需要近一步探究】
极客时间为什么需要做知识图谱?
极客时间现有的课程,大多是以 30-50 讲左右的专栏为主,这类专栏的章节,是经验比较丰富的作者针对一些特定的问题进行专门的解释,因此整体内容偏向贯穿一些主题的认知提升型。
这也决定了极客时间的主体用户群,是有 2 年以上经验的、愿意再持续学习的、有知识付费意识的、有自主学习能力的 IT 从业人员。
这种用户主体的结构存在一些典型的问题: 1. 大多数普通程序员,主动持续学习的意愿有所不足 2. 有一定经验的程序员,没有更早接触到平台,因此流量入口的问题会持续存在 3. 付费意识 需要有更强烈的价值感知,而已有内容对价值感知的提升不明显 4. 自主学习能力 需要靠 内容、机制、工具 等共同提升
所以,极客时间要想更好地发展,需要解决上述几个问题。梳理一下,可以归结为以下方面:
- 提升普通程序员的学习意愿
- 提升平台承接入门级或初级程序员的能力
- 提升平台承接非付费程序员的能力
- 提升学习者自主学习的能力
上面的每一个方向,各自都是一个主题,也都有很多细分的方案,这里不单独分析拆解,而是以知识图谱作为其中一个方案进行探讨。
思考「知识地图」和「知识图谱」的联系和适用性。
思考 「记忆宫殿」和「知识地图」和「知识图谱」的联系。
知识图谱的模式,从其中两个角度可以做最初的尝试:
- 以特定组件为导向的知识图谱构建
- 以特定工作为导向的知识图谱构建
谁来做? (模式上)
- 图谱大纲由谁来做?
- 内容由谁来做?
可能是什么样子?
- https://www.w3cschool.cn/vuejs3/vuejs3-f2k73f1y.html
- https://roadmap.sh/sql
- https://baike.baidu.com/item/%E5%86%85%E5%AD%98%E6%95%B0%E6%8D%AE%E5%BA%93/8539890
由谁来做?(实现上)
- 人工绑定关联
- 标签聚合 + 人工维护
用什么做?
- 先人工用文本的方式做内容 demo
- 再用白板等方式做演示 demo
- 最后再决定要做之后再开发相关工具
The truth you believe and cling to makes you unavailable to hear anything new.
— Pema Chödrön
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!