历史博客

请看 http://pandoc.org/MANUAL.html#pandocs-markdown

基于 xaringan1 做了两个用于测试的幻灯片:

效果非常好,就是 Google 字体,因为墙的关系加载很慢

继续阅读

LaTeX

  1. LaTeX2e unofficial reference manual
  2. 一份不太简短的 LaTeX2e 介绍

R

  1. R: A Language and Environment for Statistical Computing

继续阅读

最近几天,尤其今天,让我想到一首词 乍暖还寒时候,最难将息。三杯两盏淡酒,怎敌他、晚来风急。 晚上睡不着,白天没精神,懒着不想动,论文还是年前的样子,今天打算写了,跑到图书馆,操起笔又先写起博客来,发现自从当初建的博客,后来一直没写东西。不管怎样,先熟悉熟悉,找找感觉,尽快把之前做的东西整理出来,先交一篇初稿。 昨天从 COS 主站发的文章《随机数生成及其在统计模拟中的应用》搬过来重新排版,其实是搬进 Rmd 文档中,输出为 PDF 格式文件,为何这么做呢?一舍友很喜欢 PDF 格式的文档,他是业余摄影师,在出版社长期实习过,对排版有无穷无尽的追求,问我统计之都的文章都有PDF文件吗?我说大都没有,但是可以在文章页面用 Google 浏览器打印,效果不错的,他听后一脸无赖。他和我一样讨厌 Word 喜欢 LaTeX。后来,在我的鼓动下,他打算写一篇统计学三大检验的文章投过来,但是他要用 LaTeX 排。我说统计之都最终都是网页形式刊登文章,用 R Markdown 或者 Markdown 文档编辑,他说不知道怎么用,Pandoc 更没听说过。其实,只要有 LaTeX 源码,通过 Pandoc 也是可以很好地转化为 md 格式的文档的,我答应他,若是他写出来了,我来负责转化格式。 这里给出重新排版的文章 《随机数生成及其在统计模拟中的应用》,PDF 文档,要获取 Rmd 格式的源文件,只要在浏览器地址栏中将 .pdf 扩展名替换为 .Rmd 即可下载相应的 R Markdown 文档 说到这,想到谢大对 beamer 幻灯片的反对,早期他也是大量使用 beamer 做幻灯片的,后来蜜汁喜欢网页,喜欢 HTML/CSS/JS,所以亲自操刀写了 xaringan 包1,慢慢地我也开始喜欢这种网页形式的幻灯片了。因为它们支持更加广泛的图片格式,广到多增加两位 SVG 和 GIF,我看来也是最重要的两位。有好些LOGO不用费心去用 Inkscape 做转化了2 。 由于我还没掌握 xaringan 包的使用,再加上最近不少时间都在制作论文模板,用的是 bookdown 和 Pandoc 模板,自然用它们来做幻灯片,做一个妥协,让自己的幻灯片没有 beamer 风,而且尽量简洁,和谢大的要求保持一致,其实也不是为了迎合他,而是我觉得同是 LaTeX 坑里呆过的人,都不太喜欢蓝色的 Madrid 和 Warsaw,我还好,没有谢大那么的讲究,而且我比较喜欢极简和小清新的蓝调。说到这,我把御用模板分享在这里。

继续阅读

随机数 随机数检验 安装依赖库 sudo apt-get update && sudo apt-get install -y libgsl-dev libdieharder-dev 安装并加载 RDieHarder 包 if( ! "RDieHarder" %in% list.files(.libPaths()) ) install.packages('RDieHarder') ## Installing package into '/home/travis/R/Library' ## (as 'lib' is unspecified) library(RDieHarder) # 加载 RDieHarder [@R-RDieHarder] 由 Dirk Eddelbuettel 开发,将 Robert G. Brown 的工作介绍给 R 用户 if( ! "purrr" %in% list.files(.libPaths()) ) install.packages('purrr') library(purrr) dieharderGenerators() %>% head ## names id ## 1 borosh13 0 ## 2 cmrg 1 ## 3 coveyou 2 ## 4 fishman18 3 ## 5 fishman20 4 ## 6 fishman2x 5 dieharderTests() %>% head ## names id ## 1 diehard_birthdays 0 ## 2 diehard_operm5 1 ## 3 diehard_rank_32x32 2 ## 4 diehard_rank_6x8 3 ## 5 diehard_bitstream 4 ## 6 diehard_opso 5 set.

继续阅读

引言 网络可视化与 R 语言 网站终于测试完了,新建一个 PR 用于此篇博文,预览在哪里,预览在这里!! 开发者贡献关系网络 安装 R 包 if( ! "geomnet" %in% list.files(.libPaths()) ) install.packages("geomnet") 加载绘图的 R 包 library(magrittr) library(scales) library(ggplot2) library(geomnet) 数据获取和描述 下载数据 pdb <- tools::CRAN_package_db() 查看数据集 pdb 的大小 dim(pdb) #> [1] 13505 65 每个 R 包都有一个 DESCRIPTION 文件,顾名思义,即描述说明 R 包内容的文件,举例如 tools packageDescription('tools') #> Package: tools #> Version: 3.5.1 #> Priority: base #> Title: Tools for Package Development #> Author: R Core Team #> Maintainer: R Core Team <R-core@r-project.

继续阅读

源起 从JD总部送完三方返回学校的过程中,我大约有两个小时的时间在地铁上,这种时间我一般会开始百度雍和宫、张自忠路等地铁站名,看看为什么会叫这个名字,当是了解北京的历史了。对北京历史的认识我还停留在清朝,初高中课本里对清朝及以后的介绍不叫历史,那叫政治宣传。我对清朝历史的认识来源于电视剧,我目前看了《康熙王朝》(陈道明饰)、《雍正王朝》(唐国强饰)、《乾隆王朝》(焦晃饰)以及徐峥主演的《李卫当官》和《大内低手》,后来又看了《李卫辞官》、《步步惊心》。别的暂时想不起来了,《铁齿铜牙纪晓岚》和《康熙微服私访记》就不说了,完全逗大家玩。有时间了准备再看下《大明王朝1566》 言归正传 今天在看完张自忠路的介绍后,我又开始翻 COSer 的博客,希望某一天相见的时候,有些话题可以聊。益辉的博客每隔一段时间都会去翻的,今天也不例外,首先看到的是一堆博客更新了,不知道从哪一篇下手,就先随手翻目录,再一次地看到穷折腾。自从被刘海洋等人用这个词怼过之后,穷折腾 三个字已经在我心里留下了阴影。再一看益辉写作的时间,我在心里打鼓了,我知道很有可能在说我,点开之后,却发现真的在说我。汗汗汗 部分 Linux 用户乐于在仔细查看官方文档之前轻信网上过时的资料,并在读源代码的时候一知半解,对此我深表遗憾。在这个基础上写出来的冗余代码,我称之为穷折腾。 首先,我没有去网上看什么过时的资料,我手边一直有一本胡伟著的《LaTeX2e 完全学习手册》(第二版),在此之前是一份不太简短的 LaTeX2e 介绍,当然啦!现在说这些没有多大意义,也不能证明什么!刘海洋一上来很武断地判断我就是他自认为的那种用户,此处细节请看我在 Github 提的issues,一方面我承认在 Pandoc 、R Markdown、LaTeX 之间的关系理解的不深,另外对于 CTeX 和字体也不是很清楚,提的这个问题在开发者看来就比较弱智了,因为他们认为字体什么的可以自己写代码重定义,如果动不动就要用户自定义,这好像就是在要求用户具有开发者的潜质啊!更气人的是,还要把我使用 Linux 的事情怼一遍,以便他好有道理似的,好像用户就不能使用 Linux,不然就是穷折腾。 回答益辉的关切 我早该料到这个结果的,因为早在他折腾 CentOS 时,我就感觉不太对劲(他不回答我为什么作为一个刚接触 CentOS 系统时间不长、却非得对这个系统这么执着,还要卯足了劲要生死往前冲,感觉这就是纯粹为了折腾而折腾)。 我在 COS 论坛上是看到的,我忘了当时为什么没有正面回答这个问题了,2017年9月至11月期间,我在新浪公司运维部做数据分析实习生,这个部门有的是数据和服务器,装的都是 CentOS ,据说 Ubuntu 也有服务器版本,也有人和公司用它做服务器上的操作系统,但为啥我就是没有听说过身边的人用呢?隔壁网易也是用的 CentOS。在这样统一的环境下,我自然也接触上了 CentOS,期间也接触了 Dirk Eddelbuettel 大人的 rocker 项目,当时的 rocker 带的是2013版的 TeXLive,不继续装 texlive-full 还真是挺麻烦的1,再加上又装了一些分析用的 R 包,等到要 commit 的时候,发现 docker 太大了,没法部署。还是要直面困难,临时解决中文的方案很不可取,至少这个不可取。高老板建议我基于 CentOS minimal 开始搭建一个新的 rocker (暂且让我这样盗用这个名词吧),这就是我的全部原因。 后来 后来就有我积极参与 tinytex 测试的事了,我曾问益辉 tinytex 会不会直接支持 CentOS,答案是他本人对 CentOS 不熟悉,还有他认为问题在于找到 CentOS 下一个合适的工具解锁那一坨依赖。其实我发现没那么麻烦,也不用借助 tinytex 包装 TinyTeX 发行版,把安装过程给人为的弄复杂了2。不可否认的是 tinytex 和 rmarkdown 的组合拳自动找依赖去编译文档还是可圈可点的。为什么 tlmgr 在安装某个 tex 包的时候,不能像安装 R 包那样顺便把它的依赖给装了呢!非要等到 tinytex 包出来,在编译发生错误的日志中提取缺失的 tex 包,再逐个安装。

继续阅读

R Markdown Markdown1 R Markdown2 Pandoc’s Markdown3 You can embed an R code chunk like this: summary(cars) ## speed dist ## Min. : 4.0 Min. : 2 ## 1st Qu.:12.0 1st Qu.: 26 ## Median :15.0 Median : 36 ## Mean :15.4 Mean : 43 ## 3rd Qu.:19.0 3rd Qu.: 56 ## Max. :25.0 Max. :120 fit <- lm(dist ~ speed, data = cars) fit ## ## Call: ## lm(formula = dist ~ speed, data = cars) ## ## Coefficients: ## (Intercept) speed ## -17.

继续阅读