用 Pyecharts 绘制足迹地图

之前上网发现一个好玩的在线工具:中国制霸生成器,可以标记去过的地方,制作自己的足迹地图。 但这个工具只能标记省级行政区,有些颗粒度太粗,比如去过郫县,在地图上就会体现为去过四川。于是想看看有其他工具没有。然后发现 Pyecharts 可以绘制地图,设置一下就能生成足迹地图,而且生成的是可以交互的地图 html 文件,不是图片。如果想要图片进行分享,截个图就 OK。 Pyecharts是个Python的绘图库,除了地图,还能绘制其他很多类型的可视化图像,具体可参考Pyechart官网。 ...

2023年8月13日 · 17 分钟 · tsingk

用 seaborn 绘制数据分布统计图

数据文件为 Libreoffice 编制的 ods 类型,为了能直接读取 ods 文件生成 dataframe 格式数据,安装 pandas_ods_reader 包。 1 pip install pandas_ods_reader 然后导入相关库,读取数据。 1 2 3 4 5 6 7 import seaborn as sns import pandas as pd from pandas_ods_reader import read_ods %matplotlib inline ffftime = read_ods('dataset.ods', 1) 1 2 3 # 挑取目标列数据 thedata = ffftime.loc[ffftime['人种']=='黄', ['连续输出1']] print(len(thedata)) 195 目标列中一共有 195 个待分析数据。对这些数据绘制直方图,查看各数据段内的分布占比,图中柱宽为 2。 1 2 3 4 5 6 7 8 9 # 绘制密度分布图 rc = {'axes.unicode_minus': False} sns.set(context='notebook', style='ticks', font='simhei', rc=rc) ax = sns.histplot(data=thedata, x='连续输出1', binwidth=2, stat='proportion') x = range(0, 50, 5) ax.set_xticks(x) ax.set_ylabel("占比", fontsize=14) ax.set_xlabel("连续输出时间/min", fontsize=14) ax.set_title('连续输出时间样本统计', fontsize=14) 从占比直方图可以看出,5~7min 为占比最多区间,大约的18.5%样本落在此区间。 ...

2022年11月21日 · 2 分钟 · tsingk

设置 seaborn 绘图中的字体及字体大小

1 设置 seaborn 绘图中的字体 Seaborn 基于 Matplotlib,Matplotlib 基于 Python,Python 运行于电脑系统中。 因此,要在 Seaborn 中使用某款字体,该字体要满足以下条件: 字体已安装在系统中; Python 能检索到此字体; Matplotlib 字体缓存中能检索到此字体; 绘图时在 Seaborn 中设置使用该字体。 1.1 在电脑上安装字体 以「文泉驿微米黑」字体为例,下载到的字体安装包为「文泉驿微米黑.ttf」,双击会自动打开系统自带的字体管理器,点击安装既可。 ...

2021年11月24日 · 5 分钟 · tsingk

用 seaborn 绘图,分析西北七市潮湿度变化

年初写了篇文章《2020 年,西安气温变舒适了》,通过对过去几年平均月度气温的分析,可看出: 2020 年西安确实变温暖了,但夏天却比其他年份要稍微凉快点。 根据生活体验,除了气温,感觉近几年也越来越潮湿。年中网上有篇文章,标题大意是「西北地区正变得湿热,西安恐成最大赢家」,这说法相当惊艳。反正找数据,顺带找来西北七个市区的,一同分析下是不是这样。 气相数据集来自一款软件「小麦芽」,内容为各地气象站逐年数据,分别是:泾河站(西安)、榆中站(兰州)、银川站、酒泉站、西宁站、格尔木站、乌鲁木齐站。有五个气象站位于西北五省省会,甘肃和青海因为地域太广袤,各选了距离一千多公里的两个气相站。数据集中与潮湿有关的参数有四个:年降水量、年降水天数、露点温度、单日最大降水量。 ...

2021年11月16日 · 8 分钟 · tsingk

学习 seaborn [07]: 绘制累积条形图

使用 seaborn 绘制累积条形图 最近想看下某地区近几年降雨量如何变化,获得的数据是分年分月的,打算绘制按年份累积每月降雨量的条形图。搜索教程,主要有以下几种方法。 方法1:使用 seaborn 的 barplot() 函数,在 x 相同位置,分别绘制112月累积量、111月累积量、1~10月累积量,以此类推直至1月降雨量。每次绘制使用颜色不同,后绘制的相当于把前绘制的条状遮住一部分。需要调用12次 barplot() 函数。参考文章点这里 方法2:使用 matplotlib 的 bar() 函数,按年分别绘制每月的降雨量条形图,通过参数bottom指定所绘制的月份条形图下方是哪个月的条形图,相当于一层一层的柱子码起来。需要调用12次 bar() 函数。参考文章点这里 方法3:使用 seaborn 的 histplot() 函数,设置 multiple 参数为 stack,weights 参数为需要累积的量,既可绘制累积条形图。只需条用1次 histplot() 函数。参考文章点这里。这篇文章另外还介绍了如何使用 matplotlib、pandas、plotnine、altair 绘制累积条形图。 前两种方法太繁琐,采用第3种方法。搜相关教程有个感悟,要想快速准确找到资料,搜英文文章,或者直接在 seaborn 官方教程找。 ...

2021年11月8日 · 3 分钟 · tsingk

《可视化沟通》读后

这本书可以作为了解信息图的入门,所讲内容更贴切于互联网行业和广告营销方面。对于科研或工程行业,要用信息图表达一些严肃且全面的内容,可能就不能按作者在本书所讲的方式去处理信息图。 总结了一些自己觉得有用的内容。 信息图的意义 创造语境来表达数据或流程,以致数据或流程能够被理解。 并不是所有信息图都需要统计数据,如地铁线路图、摇滚乐发展历史之类的信息图就没有数据可视化; 创造语境经常用对比的方式,如用全世界人口数来对比网民人数,体现网络的普及。 信息图的优点来自于「图像优势」,即图像比文字更能加深记忆。 信息图的图像需与数据相关; 图像元素主要是数据可视化和插画。 「对于信息图中传递的任何信息,读者们都应该保持怀疑,大部分人没有太强的批判性思考精神」。 信息图分类 作为可视化解释的信息图:不含有数据可视化,但用图像来表达主题。 ...

2016年11月12日 · 3 分钟 · tsingk