style: html to md syntax

2023-08-24 10:31:27 +08:00
parent 229e847514
commit 0a96f3658b
88 changed files with 459 additions and 459 deletions
--- a/4.人工智能/4.6.6.2.2.7利用上下文信息.md
+++ b/4.人工智能/4.6.6.2.2.7利用上下文信息.md
@@ -12,12 +12,12 @@

 - 时间信息对于用户的的影响可以主要分为以下几项：

-  - <strong>用户的兴趣是变化的</strong>
+  - **用户的兴趣是变化的**
    对于一个用户，其幼年时期和青年时期喜欢的动画片是不一样的；晴天和雨天想要的物品是不一样的；一个人开始工作前和开始工作后的需求也是不同的。
    所以应该关注用户的近期行为，确定他的兴趣，最后给予用户推荐。
-  - <strong>物品具有生命周期</strong>
+  - **物品具有生命周期**
    流行物品会随着热度持续火爆一段时间，但最终会无人问津；生活必需品无论在什么时候都有稳定的需求量。
-  - <strong>季节效应</strong>
+  - **季节效应**
    正如概述中列出的冬衣与夏衣的区别，应该在合适的季节给用户推荐合适的物品。

 ### 系统时间特性分析
@@ -25,10 +25,10 @@
 - 当系统由之前的静态系统变成随时间变化的时变系统后，需要关注特性也会发生变化，则需要重新观测一些数据，以推断系统的关于时间变化的特性。
  下面是一些可以用来观测的数据：

-  - <strong>确定系统的用户增长数</strong>，以判断系统的增长情况或是衰退情况。
-  - <strong>物品的平均在线天数</strong>，即将满足用户物品互动次数的物品标记为在线，测算物品的平均在线天数以标量物品的生命周期。
-  - 系统的时效性，判断<strong>相隔一段时间的物品流行度向量的相似度</strong>，若是相隔一段时间的相似度仍然较大，说明经过一段时间后，该物品还是被大众喜欢，则说明这件物品具有持久流行性。而对于系统来说，若是系统中大量物品的相似度变化都不大，则说明这个系统是一个推荐热度较持久物品的系统，说明系统的时效性较弱。
-  - 系统对于用户的黏着性，统计<strong>用户的平均活跃天数</strong>，或者计算<strong>相隔一段时间的用户活跃度</strong>，以此判断系统对于用户的留存力或者说黏着性。
+  - **确定系统的用户增长数**，以判断系统的增长情况或是衰退情况。
+  - **物品的平均在线天数**，即将满足用户物品互动次数的物品标记为在线，测算物品的平均在线天数以标量物品的生命周期。
+  - 系统的时效性，判断**相隔一段时间的物品流行度向量的相似度**，若是相隔一段时间的相似度仍然较大，说明经过一段时间后，该物品还是被大众喜欢，则说明这件物品具有持久流行性。而对于系统来说，若是系统中大量物品的相似度变化都不大，则说明这个系统是一个推荐热度较持久物品的系统，说明系统的时效性较弱。
+  - 系统对于用户的黏着性，统计**用户的平均活跃天数**，或者计算**相隔一段时间的用户活跃度**，以此判断系统对于用户的留存力或者说黏着性。

 ### 推荐系统的实时性

@@ -45,9 +45,9 @@

  综上，时间多样性会提高用户的满意度，所以如何在确保精度的条件下提高系统的时间多样性呢？

-  - <strong>需要用户在有新行为时，更新推荐列表</strong>
+  - **需要用户在有新行为时，更新推荐列表**
    传统的离线更新的推荐系统无法满足需求，所以需要使用实时推荐系统。
-  - <strong>需要用户在没有新行为的时候，经常变化推荐列表</strong>
+  - **需要用户在没有新行为的时候，经常变化推荐列表**
    通常采取以下三种方法：

    - 生成推荐列表时加入一定的随机性。
@@ -58,7 +58,7 @@

 ### 时间上下文推荐算法

- <strong>最近最热门</strong>
+- **最近最热门**
  一种最朴素的思想， 在系统引入了时间信息之后，最简单的非个性化推荐算法就是给用户推荐最近最热门的物品。

  给定时间 T，物品 i 在最近的流行度可定义为：
@@ -67,10 +67,10 @@
    n_i(T)= \sum_{(u,i,t) \in Train ,t<T} \frac{1}{1+\alpha(T-t)}
    $$

- <strong>时间上下文相关的 itemCF 算法</strong>
+- **时间上下文相关的 itemCF 算法**
  itemCF 算法所依赖的核心部分，在引入时间信息后可以进行进一步更新

-  - <strong>物品相似度</strong> 利用用户行为，计算物品间的相似度，用户在相隔很短的时间内喜欢的物品通常具有更高的相似度，所以可以在相似度计算公式中引入时间信息，使得相似度计算更加准确。
+  - **物品相似度** 利用用户行为，计算物品间的相似度，用户在相隔很短的时间内喜欢的物品通常具有更高的相似度，所以可以在相似度计算公式中引入时间信息，使得相似度计算更加准确。
    原本的相似度公式为：

    $$
@@ -91,7 +91,7 @@

    其中$\alpha$ 是时间衰减参数，它的取值与系统的对于自身定义有关系。收到用户兴趣变化的额外影响。

-  - <strong>在线推荐</strong> 用户近期行为相比用户很久之前的行为，更能体现用户目前的兴趣，所以在进行预测时，应当加重用户近期行为的权重，但不应该偏离用户长期行为的行为基调。
+  - **在线推荐** 用户近期行为相比用户很久之前的行为，更能体现用户目前的兴趣，所以在进行预测时，应当加重用户近期行为的权重，但不应该偏离用户长期行为的行为基调。
    原本的用户u对于物品i的兴趣$p(u,i)$ 可通过如下公式计算： 

    $$p(u,i)=\sum_{j\in N(u)}{sim(i,j)}$$  
@@ -106,11 +106,11 @@

    在上面的更新后公式中，$t_0$ 表示当前时间，该公式表明，当 $t_{uj}$ 与 $t_0$ 越靠近，和物品j相似的物品就会在用户u的推荐列表中获得更高的排名。其中的$\beta$和上文的 $\alpha$ 是一样的，需要根据系统的情况选择合适的值。

- <strong>时间上下文相关的userCF算法</strong>
+- **时间上下文相关的userCF算法**
  
    与itemCF算法类似，userCF在引入时间信息后也可以进行更新

-  - <strong>用户兴趣相似度</strong> 用户相似度在引入时间信息后，会将用户相同的逆时序选择相似度降低。简单来说，就是A一月BF1长时间在线，二月BF5长时间在线，而B一月BF5长时间在线，二月BF1长时间在线；C行为信息与A相同。如果不引入时间信息，那么AB的相似度与AC的相似度是一样的，而实际上，AC的相似度会大于AB的相似度。
+  - **用户兴趣相似度** 用户相似度在引入时间信息后，会将用户相同的逆时序选择相似度降低。简单来说，就是A一月BF1长时间在线，二月BF5长时间在线，而B一月BF5长时间在线，二月BF1长时间在线；C行为信息与A相同。如果不引入时间信息，那么AB的相似度与AC的相似度是一样的，而实际上，AC的相似度会大于AB的相似度。

    userCF的用户uv间相似度的基本公式为：  

@@ -130,7 +130,7 @@

    同样增加了一个时间衰减因子，用户uv对于i的作用时间差距越大，那么两人的相似度会相应降低。

-  - <strong>相似兴趣用户的最近行为</strong> 对于用户u来说，存在最近行为与用户u相似的用户v，那么用户v的最近行为，将会比用户u很久之前的行为更具有参考价值。
+  - **相似兴趣用户的最近行为** 对于用户u来说，存在最近行为与用户u相似的用户v，那么用户v的最近行为，将会比用户u很久之前的行为更具有参考价值。

    userCF中用户u对于物品i兴趣的基础公式为：  

@@ -146,7 +146,7 @@
    p(u,i)=\sum_{v\in S(u,k)}{w_{ui}r_{vi}} \frac{1}{1+\alpha(\vert t_0-t_{vi}\vert)}
    $$

- <strong>时间段图模型</strong>
+- **时间段图模型**
  同样是一个基于图的推荐系统模型，引入时间信息，建立一个二分图时间段图模型：

    $$
@@ -169,11 +169,11 @@
    在构建了引入时间信息的图结构后，最简单的思想就是利用PersonalRank算法给用进行个性化推荐。但由于其复杂度较高，所以引入路径融合算法。
    一般来说，图上两个点的相关度强有以下的特征：

-    - <strong>两个顶点间有很多路径</strong>
+    - **两个顶点间有很多路径**

-    - <strong>两个顶点间路径比较短</strong>
+    - **两个顶点间路径比较短**

-    - <strong>两点间不经过出度大的点</strong> ，即不经过与很多其他点相连的节点，在推荐系统思维中等效于不与过热门物品关系紧密。
+    - **两点间不经过出度大的点** ，即不经过与很多其他点相连的节点，在推荐系统思维中等效于不与过热门物品关系紧密。

 #### 路径融合算法

@@ -199,15 +199,15 @@

 ### 地点信息效应

- <strong>基于用户当前位置的推荐</strong>：对于用户当前位置，为其推荐距离更近的餐馆，娱乐场所或消费场所。
+- **基于用户当前位置的推荐**：对于用户当前位置，为其推荐距离更近的餐馆，娱乐场所或消费场所。

- <strong>基于用户活跃位置的推荐</strong>：对于用户长期活跃的区域，降低该区域内物品的权重，提高范围外物品的权重，以提高系统的新鲜度。
+- **基于用户活跃位置的推荐**：对于用户长期活跃的区域，降低该区域内物品的权重，提高范围外物品的权重，以提高系统的新鲜度。

 ### 基于位置的推荐算法

 - 明尼苏达大学的LARS推荐系统（Location Aware Recommender System,位置感知推荐系统）。

-    - <strong>对于数据的预处理</strong>
+    - **对于数据的预处理**


      将物品分为两类：(1)有空间属性的物品，餐馆，商店，旅游景点。(2)没有空间属性的物品，图书电影等。
@@ -223,9 +223,9 @@
      （用户，用户位置，物品，物品位置，评分）：记录了某个位置的用户，对于某个地点的物品的评分。


-      - <strong>研究前两组数据</strong>：发现两种特征：(1)兴趣本地化，不同位置的用户存在较大的兴趣差异，不同国家和不同地区的差异。(2)活动本地化，一个用户往往在附近的地区活动。
+      - **研究前两组数据**：发现两种特征：(1)兴趣本地化，不同位置的用户存在较大的兴趣差异，不同国家和不同地区的差异。(2)活动本地化，一个用户往往在附近的地区活动。

-    - <strong>对于不同数据的处理</strong>
+    - **对于不同数据的处理**

      - 第一种数据：LARS的基本思想是，采用树状结构来进行数据集划分。

@@ -236,7 +236,7 @@
        (3)LARS通过该节点的行为数据，利用基本推荐算法进行为用户进行推荐。

        但是，对于上述过程，若是树的深度较大，则划分到每个节点的用户数据将较少，难以训练出一个令人满意的模型。所以有改进方法如下：
-        从根节点出发，利用每个中间节点的数据训练出一个模型，而最终的推荐结果，是这一些列推荐模型所产出的推荐结果的加权结果。这个模型也被称为“<strong>金字塔模型</strong>”，其中<strong>深度</strong>是影响这个模型性能的重要参数，选取合适的深度对于该算法十分重要。
+        从根节点出发，利用每个中间节点的数据训练出一个模型，而最终的推荐结果，是这一些列推荐模型所产出的推荐结果的加权结果。这个模型也被称为“**金字塔模型**”，其中**深度**是影响这个模型性能的重要参数，选取合适的深度对于该算法十分重要。

      - 第二种数据：对于物品i在用户u推荐列表中的权重公式进行修正
        (1)首先忽略物品的位置信息，利用itemCF算法计算用户u对物品i的兴趣。