
大创周记
ACtowards
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大创笔记(二)
首先按照https://blog.csdn.net/qq_44655971/article/details/108255794?spm=1001.2014.3001.5501跑通 把轨迹数据和folium_code.py放在D盘 然后直接运行MyServlet.java,会弹出来一个交互界面 输入id和k,点击提交 需要等一会,会弹出不用颜色显示的轨迹 目前存在的问题: 1、是直接用Kafka模拟生产者和消费者暴力计算的,并且只取了前1000条,运行时间很长 2、每条轨迹的点数过多,有的有1000个点,原创 2021-02-26 12:00:35 · 382 阅读 · 0 评论 -
大创笔记(一)
首先安装tomcat,把环境变量配置好 安装完成好运行bin\startup.bat 在浏览器中输入localhost:8080后出现 说明安装成功 如果不成功,可能是8080端口被占用,参考https://blog.csdn.net/qq_37489565/article/details/85196403 将模板代码导入,如果jakarta飘红参考 把test.py放在D盘,运行MyServlet.java 会弹出一个网页 点击yue后弹出 如果点yue之后弹不出图片,可能是没有把matplotli原创 2021-02-24 19:19:43 · 400 阅读 · 0 评论 -
周记八
这两天用kafka模拟了实时数据,并进行了相似度的计算。 轨迹数据集用的是https://blog.csdn.net/u011511601/article/details/81535600里面的2.T-Drive Taxi Trajectories 首先运行ZOOKEEPER和kafka 安装教程参考https://blog.csdn.net/lh756437907/article/details/99622979 然后运行Prod.java,输入要查询的轨迹id1 再运行Consu.java,输入k,代原创 2020-08-27 11:24:02 · 235 阅读 · 0 评论 -
周记七
这周还是和上周一样,早上7点出门,晚上6点才到家吃晚饭,口语比原来顺多了,希望明天的模考能有点进步。。。 这周我继续看了上周的论文,TRAJECTORY SIMILARITY SEARCH和TRAJECTORY SIMILARITY JOIN部分实在有点难懂。。。就把下面的EXPERIMENTS部分仔细看了看。 首先是下载了不同的大数据集 通过随机相似度查询的方式来比较他们所需的时间(threshold越大,所需时间一般也越多) Scalability:增加轨迹数据的规模,时间增加了多少 Scale-up:原创 2020-08-23 17:21:03 · 166 阅读 · 0 评论 -
周记六
唔,这周真的是忙啊,每天6小时的英语课上到头昏 这周本来想在上周已学Folium的基础上看看还有没有能深入的地方,但看了很多博客觉得还是上次的那个运用不同颜色将轨迹显示最贴近我们的项目 于是就仔细地把一篇《DITA: Distributed In-Memory Trajectory Analytics》读了一遍,希望通过总结能获取一些思路。 轨迹的数量超出了the storage and processing capability of a single machine in distributed env原创 2020-08-16 17:02:03 · 222 阅读 · 0 评论 -
周记五
这周学习了python的地图可视化库Folium,成功运用不同颜色将轨迹显示出来 import folium import re f = open("C:\\Users\\容错率\\Desktop\\轨迹数据\\release\\taxi_log_2008_by_id\\1.txt") # 返回一个文件对象 line = f.readline() # 调用文件的 readline()方法 res=[] while line: #原创 2020-08-09 17:50:28 · 262 阅读 · 0 评论 -
周记四
这周我先从网上下载了轨迹数据集到本地,它是来自微软T-Drive项目,包含在2008年北京一万多俩出租车一周的轨迹数据。这个数据集包含了1500万个坐标点,轨迹的总距离达到900多万公里。 然后通过文件流的方式,逐行读入,根据格式将String拆分,将信息提取。 再定义了Point类,方便将数据包装输出。 ...原创 2020-08-02 18:57:38 · 215 阅读 · 0 评论 -
周记三
这周参考了几篇网上的博客,用java实现了Kafka消息的读取与写入,需要分别实现生产者和消费者原创 2020-07-26 16:00:39 · 141 阅读 · 0 评论 -
周记二
这周看了一些博客,把ZOOKEEPER以及KAFKA安装完成。 1.运行Zookeeper 2.运行KAFKA 3.创建TOPICS 4. 打开一个PRODUCER 5.打开一个CONSUMER 可以看到,通过命令行成功将流数据传入CONSUMER 下周目标:尝试编写java程序将kafka消息队列传入进行流处理。 ...原创 2020-07-19 17:17:17 · 179 阅读 · 0 评论 -
周记一
暑假的第一周,过的还是很忙碌的。 7号看了许多博客,遇到了各种问题,最终把fink1.93下了下来,把IDEA配置好了(之前写JAVA用的Eclipse),把maven下了下来,学别人用java写了一个wordcount,在本地成功运行。 把项目打jar包,上传Flink后台运行时,可以看到,项目确实是在运行。 但是我在命令行中输入单词时,Stdout却并没有输出显示相应的结果,不知道是什么原因。 8-10号和数学建模的队友模拟了一次比赛,码了3天Matlab还是很辛苦的。 11号和高中同学出去聚了一天原创 2020-07-12 18:21:27 · 251 阅读 · 0 评论