Skip to content

Latest commit

 

History

History
191 lines (113 loc) · 6.33 KB

README.md

File metadata and controls

191 lines (113 loc) · 6.33 KB

CDMap-成都活动地图项目介绍

软件定位及基本功能

CDMap 是一个以活动为驱动的web端娱乐地图,让用户获得更直观的信息。

颠覆地图以往固定于地点的思维,用活动去展现成都这个跃动的新一线城市。

我们的目标是整合数据和资讯,着重于人、事件、地点的结合

基本功能:

  1. 活动筛选:类型和时间的筛选,结合个性化推荐算法,在地图上获取目标信息

  2. 活动搜索与显示:以颜色标注类型,清晰明了获知活动的分布情况

  3. 用户系统:对活动进行查看、收藏、评论、分享等操作


开发环境

前端

前端部分需要在本地安装 node.js, npm 包管理器以及 yarn 包管理器,在根目录下 :

#安装
yarn install
#启动
yarn serve

后端

后端部分需要python3.7以上版本支持,须在本地安装 pip 包管理器,推荐安装 virtualenv 作为虚拟环境

#安装
cd api
pip install -r requirements.txt
#创建数据库及表
python manage.py db_create
#启动服务器
python run.py

接口说明

'/api/register' 注册
'/api/login' 登录
'/api/logout' 登出
'/api/getlikelist' 获取用户收藏
'/api/getcommentlist' 获取用户评论
'/api/geteventlist' 获取活动
'/api/geteventcomment' 获取活动评论
'/api/createcomment' 创建评论
'/api/getusercomment' 获取用户评论

算法

  1. 兴趣推荐算法 使用调整后的余弦相似度计算方法来衡量用户的兴趣倾向,并使用基于用户的协同过滤调整已经得到的用户倾向,使得在用户使用初期,数据单薄时,推送的活动更加地符合用户的心意
  • 算法示例图

  1. 计算用户之间的兴趣接近程度 将用户的兴趣倾向投射到五维空间中,进行计算。因为维度有五维并且每一维的数学意义是用户在这个方向上的兴趣程度,所以数据稳定可靠,直接采用余弦相似度算法能很准确地得到两个用户间的兴趣近似程度
  • 算法示例图(以三维空间为例)

数据来源与数据清洗

数据来源:

大麦网

摩天轮-票务

哔哩哔哩会员购

由\api\scrapydata.py程序爬取,导出csv文件\api\damaiwang.csv

数据清洗:

通过Notepad++对csv文件进行读取

对不规整的数据采用正则表达式进行过滤

如对"https://" 或 "http://"等等为开头的url地址

使用正则表达式"/http[s]{0,1}://([\w.]+/?)\S*/"即可过滤出想要的内容

数据之间以"|"为分隔,便于后续将csv文件导出为sqlite数据库

导入sqlite数据库

使用sqlitespy.exe运行

select * from 表名
into outfile '导出路径\\test.csv'
fields terminated by ','
optionally enclosed by '"'
escaped by '"'
lines terminated by '\n';
  • 需要注意的是,csv文件的编码方式应为utf-8 with BOM,否则会出现乱码情况

使用

应用根目录即为应用主程序,例如本地环境 http://localhost:8080/ 下,可在未登录的情况下使用部分功能。

功能架构图:

注册及登录

计划使用手机验证码登录,但因为时间不足没有申请云短信服务,本 demo 暂时取消账号功能,但可以在 http://localhost:8080/register 中查看注册页面,登录可以前往 http://localhost:8080/login 进行登录,提供以下试用账号

95432177 888888
13622737922 888888
13924336422 888888

用户操作与功能备注:

  1. 用户进入web端主页,可直接查看附近的活动,通过颜色进行区分
  2. 左上角的两个下拉框可进行类别和时间的筛选
  3. 用户还可通过搜索功能进行活动的搜索,搜索结果将展示在列表和地图上
    • 上方搜索可正常搜索,但未实装实时弹出
  4. 用户点击地图上的标记,可查看活动的具体信息,在登录后可进行收藏、评论和分享等操作
    • 未能填充大量测试评论,地图中间部分紫色标记(筛选选择科技)中 Hackthon 活动内填充了部分评论
    • 评论功能可以实时更新
  5. 右上角的头像是用户系统的入口,点击最后一个按钮用户可以查看自己的评论

计划

已完成前端构建或后端算法但未实装:

  1. 活动分享功能
  2. 活动收藏功能
  3. 用户相似度比较算法,可方便用户参加活动时匹配相似度高的其他用户

未完成构建的:

  1. 活动详情页的导航及购票跳转服务

  2. 交友系统:用户可在平台与其他用户进行交流,但不提供私聊服务

  3. 商家热线:提供为商家推广的服务

  4. 推荐算法优化:增加维度内容、用户特征、环境特征

    • 内容
      • 提取活动的关键字
      • 提取明星关键字
    • 用户特征
      • 职业
      • 年龄
      • 性别
    • 环境特征
      • 用户处于出门旅游状态,停留时间短
      • 用户是成都人,常居成都

    以上三个维度走DNN提取特征,由此特征调整用户的爱好倾向参数,同时活动、明星的关键字会特殊考虑。