style: html to md syntax

This commit is contained in:
Plumbiu
2023-08-24 10:31:27 +08:00
parent 229e847514
commit 0a96f3658b
88 changed files with 459 additions and 459 deletions

View File

@@ -12,12 +12,12 @@
- 时间信息对于用户的的影响可以主要分为以下几项:
- <strong>用户的兴趣是变化的</strong>
- **用户的兴趣是变化的**
对于一个用户,其幼年时期和青年时期喜欢的动画片是不一样的;晴天和雨天想要的物品是不一样的;一个人开始工作前和开始工作后的需求也是不同的。
所以应该关注用户的近期行为,确定他的兴趣,最后给予用户推荐。
- <strong>物品具有生命周期</strong>
- **物品具有生命周期**
流行物品会随着热度持续火爆一段时间,但最终会无人问津;生活必需品无论在什么时候都有稳定的需求量。
- <strong>季节效应</strong>
- **季节效应**
正如概述中列出的冬衣与夏衣的区别,应该在合适的季节给用户推荐合适的物品。
### 系统时间特性分析
@@ -25,10 +25,10 @@
- 当系统由之前的静态系统变成随时间变化的时变系统后,需要关注特性也会发生变化,则需要重新观测一些数据,以推断系统的关于时间变化的特性。
下面是一些可以用来观测的数据:
- <strong>确定系统的用户增长数</strong>,以判断系统的增长情况或是衰退情况。
- <strong>物品的平均在线天数</strong>,即将满足用户物品互动次数的物品标记为在线,测算物品的平均在线天数以标量物品的生命周期。
- 系统的时效性,判断<strong>相隔一段时间的物品流行度向量的相似度</strong>,若是相隔一段时间的相似度仍然较大,说明经过一段时间后,该物品还是被大众喜欢,则说明这件物品具有持久流行性。而对于系统来说,若是系统中大量物品的相似度变化都不大,则说明这个系统是一个推荐热度较持久物品的系统,说明系统的时效性较弱。
- 系统对于用户的黏着性,统计<strong>用户的平均活跃天数</strong>,或者计算<strong>相隔一段时间的用户活跃度</strong>,以此判断系统对于用户的留存力或者说黏着性。
- **确定系统的用户增长数**,以判断系统的增长情况或是衰退情况。
- **物品的平均在线天数**,即将满足用户物品互动次数的物品标记为在线,测算物品的平均在线天数以标量物品的生命周期。
- 系统的时效性,判断**相隔一段时间的物品流行度向量的相似度**,若是相隔一段时间的相似度仍然较大,说明经过一段时间后,该物品还是被大众喜欢,则说明这件物品具有持久流行性。而对于系统来说,若是系统中大量物品的相似度变化都不大,则说明这个系统是一个推荐热度较持久物品的系统,说明系统的时效性较弱。
- 系统对于用户的黏着性,统计**用户的平均活跃天数**,或者计算**相隔一段时间的用户活跃度**,以此判断系统对于用户的留存力或者说黏着性。
### 推荐系统的实时性
@@ -45,9 +45,9 @@
综上,时间多样性会提高用户的满意度,所以如何在确保精度的条件下提高系统的时间多样性呢?
- <strong>需要用户在有新行为时,更新推荐列表</strong>
- **需要用户在有新行为时,更新推荐列表**
传统的离线更新的推荐系统无法满足需求,所以需要使用实时推荐系统。
- <strong>需要用户在没有新行为的时候,经常变化推荐列表</strong>
- **需要用户在没有新行为的时候,经常变化推荐列表**
通常采取以下三种方法:
- 生成推荐列表时加入一定的随机性。
@@ -58,7 +58,7 @@
### 时间上下文推荐算法
- <strong>最近最热门</strong>
- **最近最热门**
一种最朴素的思想, 在系统引入了时间信息之后,最简单的非个性化推荐算法就是给用户推荐最近最热门的物品。
给定时间 T物品 i 在最近的流行度可定义为:
@@ -67,10 +67,10 @@
n_i(T)= \sum_{(u,i,t) \in Train ,t<T} \frac{1}{1+\alpha(T-t)}
$$
- <strong>时间上下文相关的 itemCF 算法</strong>
- **时间上下文相关的 itemCF 算法**
itemCF 算法所依赖的核心部分,在引入时间信息后可以进行进一步更新
- <strong>物品相似度</strong> 利用用户行为,计算物品间的相似度,用户在相隔很短的时间内喜欢的物品通常具有更高的相似度,所以可以在相似度计算公式中引入时间信息,使得相似度计算更加准确。
- **物品相似度** 利用用户行为,计算物品间的相似度,用户在相隔很短的时间内喜欢的物品通常具有更高的相似度,所以可以在相似度计算公式中引入时间信息,使得相似度计算更加准确。
原本的相似度公式为:
$$
@@ -91,7 +91,7 @@
其中$\alpha$ 是时间衰减参数,它的取值与系统的对于自身定义有关系。收到用户兴趣变化的额外影响。
- <strong>在线推荐</strong> 用户近期行为相比用户很久之前的行为,更能体现用户目前的兴趣,所以在进行预测时,应当加重用户近期行为的权重,但不应该偏离用户长期行为的行为基调。
- **在线推荐** 用户近期行为相比用户很久之前的行为,更能体现用户目前的兴趣,所以在进行预测时,应当加重用户近期行为的权重,但不应该偏离用户长期行为的行为基调。
原本的用户u对于物品i的兴趣$p(u,i)$ 可通过如下公式计算:
$$p(u,i)=\sum_{j\in N(u)}{sim(i,j)}$$
@@ -106,11 +106,11 @@
在上面的更新后公式中,$t_0$ 表示当前时间,该公式表明,当 $t_{uj}$ 与 $t_0$ 越靠近和物品j相似的物品就会在用户u的推荐列表中获得更高的排名。其中的$\beta$和上文的 $\alpha$ 是一样的,需要根据系统的情况选择合适的值。
- <strong>时间上下文相关的userCF算法</strong>
- **时间上下文相关的userCF算法**
与itemCF算法类似userCF在引入时间信息后也可以进行更新
- <strong>用户兴趣相似度</strong> 用户相似度在引入时间信息后会将用户相同的逆时序选择相似度降低。简单来说就是A一月BF1长时间在线二月BF5长时间在线而B一月BF5长时间在线二月BF1长时间在线C行为信息与A相同。如果不引入时间信息那么AB的相似度与AC的相似度是一样的而实际上AC的相似度会大于AB的相似度。
- **用户兴趣相似度** 用户相似度在引入时间信息后会将用户相同的逆时序选择相似度降低。简单来说就是A一月BF1长时间在线二月BF5长时间在线而B一月BF5长时间在线二月BF1长时间在线C行为信息与A相同。如果不引入时间信息那么AB的相似度与AC的相似度是一样的而实际上AC的相似度会大于AB的相似度。
userCF的用户uv间相似度的基本公式为
@@ -130,7 +130,7 @@
同样增加了一个时间衰减因子用户uv对于i的作用时间差距越大那么两人的相似度会相应降低。
- <strong>相似兴趣用户的最近行为</strong> 对于用户u来说存在最近行为与用户u相似的用户v那么用户v的最近行为将会比用户u很久之前的行为更具有参考价值。
- **相似兴趣用户的最近行为** 对于用户u来说存在最近行为与用户u相似的用户v那么用户v的最近行为将会比用户u很久之前的行为更具有参考价值。
userCF中用户u对于物品i兴趣的基础公式为
@@ -146,7 +146,7 @@
p(u,i)=\sum_{v\in S(u,k)}{w_{ui}r_{vi}} \frac{1}{1+\alpha(\vert t_0-t_{vi}\vert)}
$$
- <strong>时间段图模型</strong>
- **时间段图模型**
同样是一个基于图的推荐系统模型,引入时间信息,建立一个二分图时间段图模型:
$$
@@ -169,11 +169,11 @@
在构建了引入时间信息的图结构后最简单的思想就是利用PersonalRank算法给用进行个性化推荐。但由于其复杂度较高所以引入路径融合算法。
一般来说,图上两个点的相关度强有以下的特征:
- <strong>两个顶点间有很多路径</strong>
- **两个顶点间有很多路径**
- <strong>两个顶点间路径比较短</strong>
- **两个顶点间路径比较短**
- <strong>两点间不经过出度大的点</strong> ,即不经过与很多其他点相连的节点,在推荐系统思维中等效于不与过热门物品关系紧密。
- **两点间不经过出度大的点** ,即不经过与很多其他点相连的节点,在推荐系统思维中等效于不与过热门物品关系紧密。
#### 路径融合算法
@@ -199,15 +199,15 @@
### 地点信息效应
- <strong>基于用户当前位置的推荐</strong>:对于用户当前位置,为其推荐距离更近的餐馆,娱乐场所或消费场所。
- **基于用户当前位置的推荐**:对于用户当前位置,为其推荐距离更近的餐馆,娱乐场所或消费场所。
- <strong>基于用户活跃位置的推荐</strong>:对于用户长期活跃的区域,降低该区域内物品的权重,提高范围外物品的权重,以提高系统的新鲜度。
- **基于用户活跃位置的推荐**:对于用户长期活跃的区域,降低该区域内物品的权重,提高范围外物品的权重,以提高系统的新鲜度。
### 基于位置的推荐算法
- 明尼苏达大学的LARS推荐系统Location Aware Recommender System,位置感知推荐系统)。
- <strong>对于数据的预处理</strong>
- **对于数据的预处理**
将物品分为两类:(1)有空间属性的物品,餐馆,商店,旅游景点。(2)没有空间属性的物品,图书电影等。
@@ -223,9 +223,9 @@
(用户,用户位置,物品,物品位置,评分):记录了某个位置的用户,对于某个地点的物品的评分。
- <strong>研究前两组数据</strong>:发现两种特征:(1)兴趣本地化,不同位置的用户存在较大的兴趣差异,不同国家和不同地区的差异。(2)活动本地化,一个用户往往在附近的地区活动。
- **研究前两组数据**:发现两种特征:(1)兴趣本地化,不同位置的用户存在较大的兴趣差异,不同国家和不同地区的差异。(2)活动本地化,一个用户往往在附近的地区活动。
- <strong>对于不同数据的处理</strong>
- **对于不同数据的处理**
- 第一种数据LARS的基本思想是采用树状结构来进行数据集划分。
@@ -236,7 +236,7 @@
(3)LARS通过该节点的行为数据利用基本推荐算法进行为用户进行推荐。
但是,对于上述过程,若是树的深度较大,则划分到每个节点的用户数据将较少,难以训练出一个令人满意的模型。所以有改进方法如下:
从根节点出发,利用每个中间节点的数据训练出一个模型,而最终的推荐结果,是这一些列推荐模型所产出的推荐结果的加权结果。这个模型也被称为“<strong>金字塔模型</strong>”,其中<strong>深度</strong>是影响这个模型性能的重要参数,选取合适的深度对于该算法十分重要。
从根节点出发,利用每个中间节点的数据训练出一个模型,而最终的推荐结果,是这一些列推荐模型所产出的推荐结果的加权结果。这个模型也被称为“**金字塔模型**”,其中**深度**是影响这个模型性能的重要参数,选取合适的深度对于该算法十分重要。
- 第二种数据对于物品i在用户u推荐列表中的权重公式进行修正
(1)首先忽略物品的位置信息利用itemCF算法计算用户u对物品i的兴趣。