学习 seaborn [04]: 修改样式、移动座标轴

title: 学习 seaborn [04]: 修改样式、移动座标轴 slug: beautify-seaborn date: 2020-12-11 16:23:05 tags: seaborn python category: 数据分析 link: description: type: text 控制图像的美学样式 相比与matplotlib详细的样式设置,seaborn提供了成套的样式主题可供直接使用,同时提供高级设置接口供用户自定义主题。 以装修房子比喻,用matplotlib就像全部考自己装修,窗台、地砖、墙壁等细节都要自己考虑,费时费力但高度可定制化。而用seaborn相当于从装修公司已设计好的装修方案中挑选一个,然后还能在此基础进行部分的修改定制。 ...

2020年12月11日 · 4 分钟 · tsingk

学习 seaborn [03]: 线性回归图

title: 学习 seaborn [03]: 线性回归图 slug: lmplot date: 2020-12-9 tags: seaborn python category: 数据分析 link: description: type: text 线性关系可视化 此线性可视化并非统计关系中的折线图,而是excel做图中的趋势线概念,对x、y关系进行线性拟合得到关系式,对关系式的绘图。 seaborn的线性可视化不直接提供拟合关系式的各具体参数,只绘制出趋势线和置信区间,从而引导和帮助进行数据关系探索。 主要用到两个函数: lmplot():FacetGrid级函数,可绘制多子图;将data作为必须参数,x和y变量必须被指定为字符串。 regplot():轴级函数。x和y可以是简单的 numpy 数组,pandas Series对象,或者作为对传递给data的 pandas DataFrame对象。 1 2 3 4 5 6 7 8 import seaborn as sns import pandas as pd import numpy as np %matplotlib inline sns.set() tips = pd.read_csv('seaborn-data-master/tips.csv') display(tips) total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 ... ... ... ... ... ... ... ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 244 rows × 7 columns ...

2020年12月9日 · 3 分钟 · tsingk

学习 seaborn [02]: 条形图、线箱图 & 分类散点图

可视化分类数据 可视化分类数据的统一FacetGrid图级接口为catplot()函数,通过kind参数,可以选择轴级函数有: 分类散点图: stripplot() (with kind=“strip”; the default) swarmplot() (with kind=“swarm”) 分类分布图: boxplot() (with kind=“box”) violinplot() (with kind=“violin”) boxenplot() (with kind=“boxen”) 分类估计图: pointplot() (with kind=“point”) barplot() (with kind=“bar”) countplot() (with kind=“count”) 条形图 绘制两种不同的条形图: barplot() 或 catplot(kind=‘bar’):x为分类,y为该分类下的数据的估计值;需要给x、y赋值。 countplot() 或 catplot(kind=‘count’):x为分类,y为该分类下的数据的数量;只需给x赋值。 两种图形的其他参数使用方法一致。 ...

2020年12月3日 · 2 分钟 · tsingk

学习 seaborn [01]: 散点图 & 线型图

title: 学习 seaborn [01]: 散点图 & 线型图 slug: seaborn-scatter-line date: 2020-11-30 tags: seaborn python category: 数据分析 link: description: type: text 可视化统计关系 表示统计关系的图分为散点图和线型图两类。统一的FacetGrid图级接口函数为relplot()。 散点图 1 2 3 4 5 6 7 8 9 10 import seaborn as sns import pandas as pd %matplotlib inline # seaborn预设主题:darkgrid(默认),whitegrid,dark,white 以及 ticks sns.set() # 导入数据集。由于sns.load_dataset连接不上服务器,使用pandas导入本地下载的数据集 tips = pd.read_csv('seaborn-data-master/tips.csv') display(tips) total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 ... ... ... ... ... ... ... ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 244 rows × 7 columns ...

2020年11月30日 · 3 分钟 · tsingk

利用Calibre通过RSS将抓取的文章生成电子书

最近发现一豆瓣博主写的基金类日记很有启发,但由于博主至少一个礼拜才更新一篇,看新文章时旧文章都记不清了,于是想把日记保存成电子书再从头看一遍。 想起 Calibre 有通过 RSS 将抓取的文章生成电子书的功能,刚好豆瓣日记也提供 RSS 订阅源,于是就开始尝试一下。 本方法也适用于豆瓣以外其他内容平台,前提是能找到相应的 RSS 订阅源。 安装 Calibre Calibre 是一个电脑上的电子书管理软件,功能强大,而且可以安装各种插件,支持 Linux、Windows、Mac 全平台。一直用它管理电子书。 ...

2020年11月22日 · 3 分钟 · tsingk

利用 Python 计算基金组合指数

练习Python,计算指数基金组合对应的指数,并绘制变化趋势。 基金组合信息 基金组合中一共有 7 支基金,分别为a,b,c,d,e,f,g。创建一个 Dataframe 用来存放各支基金在组合中的份额占比以及跟踪的指数。指数代码从新浪财经查找。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 import pandas as pd data1 = {'rate': [0.2097, 0.0989, 0.0966, 0.0884, 0.2174, 0.1906, 0.0984], 'indexname': ['上证指数', '中证500', '沪深300', '上证指数', '上证指数', '深证金融地产行业指数', '上证指数'], 'indexnum': ['sh000001', 'sh000905', 'sh000300', 'sh000001', 'sh000001', 'sz399619', 'sh000001'] } df1 = pd.DataFrame(data1, index=list('abcdefg')) display(df1) rate indexname indexnum a 0.2097 上证指数 sh000001 b 0.0989 中证500 sh000905 c 0.0966 沪深300 sh000300 d 0.0884 上证指数 sh000001 e 0.2174 上证指数 sh000001 f 0.1906 深证金融地产行业指数 sz399619 g 0.0984 上证指数 sh000001 获取各指数历史数据 利用 AkShare 获取各指数的历史数据。因为股票基金是以收盘价定价,所以只需要各指数的收盘价来合成基金组合的对应指数。 ...

2020年11月13日 · 3 分钟 · tsingk

利用 AkShare 获取上证指数

AkShare 介绍 AkShare 是基于 Python 的财经数据接口库, 目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清洗到数据落地的一套工具,主要用于学术研究目的。 可以编写 Python 代码,利用 AkShare 自动化获取股票、基金等金融数据。 项目文档:https://www.akshare.xyz/zh_CN/latest/index.html ...

2020年11月12日 · 2 分钟 · tsingk

Docker+Caddy部署RSSHub

步骤 安装 Docker 安装 Caddy 安装 RSSHub 给 RSSHub 配置域名 安装 RSSHub 参考官方文档,采用 Docker 部署,不用折腾安装配置 nodejs,简单省心。 运行下面的命令下载 RSSHub 镜像 1 2 docker pull diygod/rsshub 然后运行 RSSHub 即可。这里添加了运行配置参数,其中: -e CACHE_EXPIRE=3600 设置缓存时间为 1 小时 -e DEBUG_INFO=false 设置 RSSHub 的首页面不显示 debug 信息 1 2 docker run -d --name rsshub -p 1200:1200 -e CACHE_EXPIRE=3600 -e DEBUG_INFO=false diygod/rsshub 在浏览器中打开 服务器 ip 地址: 1200,如果显示如下 RSSHub 首页面,表示部署成功。 更多配置见官方文档。 更新 RSSHub 每隔一段时间 RSSHub 会加入新的路由,需要进行更新才能使用。 ...

2020年11月11日 · 1 分钟 · tsingk

kit,一个办公文档管理工具

项目背景 kit,一个用于管理工作文档版本的工具。项目地址:https://github.com/tsingkk/kit。 编写这个工具的目的有两个: 自学练习 Python 编程; 学以致用,试图解决自身工作中,文件和版本过多导致分不清文件版本的问题。 勘察设计行业的工作成果为设计文件,以 Word 文档和 CAD 图纸这类二进制文件为主,有别于 IT 行业常用文本文件。git 并不适合用于管理二进制文件,但非常喜欢 git 对版本的管理流程,因此就参考 git 的一般操作流程,写了 kit。对,名字也是模仿的。对 git 的模仿也仅限于操作流程和名字,原因是作为非专业人员看不懂 git 的代码和算法。对版本的管理流程也根据自己工作需要做了简化。 ...

2020年10月20日 · 4 分钟 · tsingk

Linux下word类软件对比

测试软件版本 WPS2019 国际版 11.1.0.9615 永中 Office2019 体验版 8.0.1331.101ZH.S1 FreeOffice2018 rev F976.0314 Libreoffice 7.0.0.3 测试基准 原始文档为一份 560 页的报告文档,由 MS Office 编辑而成的 docx 文件,中文为主,图表文混排。由于 MS Office 没有 Linux 版本,因此转换成 PDF 文件作为排版格式兼容性对比的基准。 对 docx 排版格式的还原度 用各测试软件打开原始 docx 文档,与基准 PDF 文档进行排版格式对比,与 PDF 文档排版有出入即为排版错误。主要记录了各软件以下几个指标: 显示 docx 文档的总页数 第一个排版错误出现的页数(不影响全文排版) ...

2020年9月6日 · 2 分钟 · tsingk