效率提升

栏目: R语言 · 发布时间: 6年前

Rmarkdown

Rmarkdown扩展了markdown的语法，所以markdown能写的，Rmarkdown能写，后者还提供了一些新的特性，特别是图表，很nice。

markdown的语法非常非常简单，用上一天就熟悉了，还没学过的随便百度谷歌下，教程已经烂大街了，如果你实在要我推荐，就看看我之前写的【软件推荐|markdown】Typora简介及Markdown语法精讲吧。

嵌入表格和图表

这也是rmarkdown吸引人的地方，通过R代码直接输出表格和图！这有赖于益辉大神写的knitr包。

先出个表试试，写个数据框：

toys = data.frame(
    id = 1:3,
    name = c("Car", "Plane", "Motocycle"),
    price = c(15, 25, 14),
    share = c(0.3, 0.1, 0.2),
    stringsAsFactors = FALSE
)

纯文本输出为：

toys
#>   id      name price share
#> 1  1       Car    15   0.3
#> 2  2     Plane    25   0.1
#> 3  3 Motocycle    14   0.2

使用 knitr::kable() 生成markdown版本的表格：

knitr::kable(toys)

id	name	price	share
1	Car	15	0.3
2	Plane	25	0.1
3	Motocycle	14	0.2

网页显示是上面这样的，实际markdown是下面这样：

| id|name      | price| share|
|--:|:---------|-----:|-----:|
|  1|Car       |    15|   0.3|
|  2|Plane     |    25|   0.1|
|  3|Motocycle |    14|   0.2|

还有其他一些扩展包可以渲染表格，例如 xtable 包可以将 data.frame 转换为LaTeX，还提供了呈现统计模型的模板：

xtable::xtable(lm(mpg ~ cyl + vs, data = mtcars))
#> % latex table generated in R 3.5.1 by xtable 1.8-2 package
#> % Fri Aug 31 18:39:26 2018
#> \begin{table}[ht]
#> \centering
#> \begin{tabular}{rrrrr}
#>   \hline
#>  & Estimate & Std. Error & t value & Pr($>$$|$t$|$) \\ 
#>   \hline
#> (Intercept) & 39.6250 & 4.2246 & 9.38 & 0.0000 \\ 
#>   cyl & -3.0907 & 0.5581 & -5.54 & 0.0000 \\ 
#>   vs & -0.9391 & 1.9775 & -0.47 & 0.6384 \\ 
#>    \hline
#> \end{tabular}
#> \end{table}

Excel是著名的分析软件，其中一个特性是条件化格式操作，任坤大神开发了 formattable 包来实现这样的特性，它能够使数据框中的单元格显示更多的比较信息：

install.packages("formattable")

下面使用看看：

library(formattable)
formattable(toys,
            list(price = color_bar("lightpink"), share = percent))

id	name	price	share
1	Car	15	30.00%
2	Plane	25	10.00%
3	Motocycle	14	20.00%

将巨大的表格直接嵌入文档并不是个好主意，JavaScript库（例如DataTables）可以很方便将大数据集嵌入网页中，它可以自动执行分页，也支持搜索与筛选。名为DT的R包可以利用这个库，实现交互式操作，方便探索大数据集。

library(DT)
datatable(mtcars)

R社区还有其他高质量的javascript库值得大家探索。

下面说说如何嵌入图。

一般的图非常简单，和平常写R代码一样，不过不在 .R 中写，而是在 .Rmd 中写，将你的代码写入如下的代码框中，使用Control+Alt+i可以直接插入一个代码框。就是说重点是代码，图R会帮我们自动生成，比如下面这个图：

set.seed(123)
x = rnorm(1000)
y = 2 * x + rnorm(1000)
m = lm(y ~ x)
plot(x, y, main = "Linear regression", col = "darkgray")
abline(coef(m))

效率提升

除了基本的绘图函数与ggplot2包，我们还可以使用其他，例如DiagrammeR包绘制流程图等。

下面生成一个有向图：

library(DiagrammeR)
grViz("
      digraph rmarkdown {
      A -> B
      B -> C
      C -> A
      }")

这个包使用Graphviz描述图的结构和样式。有这种需求就去看文档。

嵌入交互图

前面演示的都是静态的，现在咱们来玩动态的。

ggvis 是RStudio开发的一个交互图扩展包，她利用Vega作为后端支持。

library(ggvis)
mtcars %>% 
    ggvis(~mpg, ~disp, opacity := 0.6) %>% 
    layer_points(size := input_slider(1, 100, value = 50, label = "size")) %>% 
    layer_smooths(span = input_slider(0.5, 1, value = 1, label = "span"))
#> Warning: Can't output dynamic/interactive ggvis plots in a knitr document.
#> Generating a static (non-dynamic, non-interactive) version of the plot.

效率提升

这个包的语法有点像ggplot2，最好配合管道符号使用。

还有一个扩展包dygraphs专门用于绘制交互功能的时间序列数据。

创建Shiny交互式应用程序

shiny由RStudio开发，不同于前面的动图，它可以在web浏览器中运行。

一个shiny应用程序基本由两个重要部分组成：一个是Web浏览器交互的HTTP服务器，另一个是HTTP服务器交互的R会话。

下面我们写一个最小的shiny应用程序，写一个R脚本定义它的用户界面和服务器逻辑，用户界面是一个 boostrapPage ，它包含一个 numericInput 用于接收一个整数表示样本容量，一个 textOutput 用于返回随机样本的均值。服务器背后的逻辑是根据输入 input 的样本容量 n 生成随机数，计算随机样本的均值，并将结果放在 output 中。

library(shiny)

ui = bootstrapPage(
    numericInput("n", label = "Sample size", value = 10, min = 10, max = 100),
    textOutput("mean")
)

server = function(input, output){
    output$mean = renderText(mean(rnorm(input$n)))
}

app = shinyApp(ui, server)
runApp(app)

效率提升

尽管这个例子很简单，但它演示了shiny应用程序的基本组件。

下面我们看一个复杂有用的例子：可视化几何布朗运动的许多路径，几何布朗运动常用于股票价格建模，运动的结果取决于初始值、预期增长率、波动率、持续时间和周期数。除了设定T=1外，我们允许用户修改其他所有参数。

我们可以根据想展示给用户的参数来定义shiny应用程序的用户界面，shiny提供了丰富的输入控件：

shiny_vars = ls(getNamespace("shiny"))
shiny_vars[grep("Input$", shiny_vars)]
#>  [1] "checkboxGroupInput"            "checkboxInput"                
#>  [3] "dateInput"                     "dateRangeInput"               
#>  [5] "fileInput"                     "numericInput"                 
#>  [7] "passwordInput"                 "restoreInput"                 
#>  [9] "selectInput"                   "selectizeInput"               
#> [11] "serializerFileInput"           "sliderInput"                  
#> [13] "snapshotPreprocessInput"       "snapshotPreprocessorFileInput"
#> [15] "textAreaInput"                 "textInput"                    
#> [17] "updateCheckboxGroupInput"      "updateCheckboxInput"          
#> [19] "updateDateInput"               "updateDateRangeInput"         
#> [21] "updateNumericInput"            "updateSelectInput"            
#> [23] "updateSelectizeInput"          "updateSliderInput"            
#> [25] "updateTextAreaInput"           "updateTextInput"

另外我们允许用户指定随机种子数来确保相同的种子生成相同的路径。

下面是shiny提供的输出控件：

shiny_vars[grep("Output$", shiny_vars)]
#>  [1] "cancelOutput"             "dataTableOutput"         
#>  [3] "htmlOutput"               "imageOutput"             
#>  [5] "missingOutput"            "plotOutput"              
#>  [7] "snapshotPreprocessOutput" "tableOutput"             
#>  [9] "textOutput"               "uiOutput"                
#> [11] "verbatimTextOutput"

下面写代码：

library(shiny)

ui = fluidPage(
    titlePanel("Random walk"),
    sidebarLayout(
        sidebarPanel(
            numericInput("seed", "Random seed", 123),
            sliderInput("paths", "Paths", 1, 100, 1),
            sliderInput("start", "Starting value", 1, 10, 1, 1),
            sliderInput("r", "Expected return", -0.1, 0.1, 0, 0.001),
            sliderInput("sigma", "Sigma", 0.001, 1, 0.01, 0.001),
            sliderInput("periods", "Periods", 10, 1000, 200, 10)
        ),
        mainPanel(
            plotOutput("plot", width = "100%", height = "600px")
        )
    )
)

接下来我们实现服务器逻辑，首先设置随机数，然后迭代调用 sde::GBM ，这个包要先安装。

GMB生成一条路径， sapply() 将所有生成的路径组合成一个矩阵，矩阵的每一列代表一条路径，然后使用 matplot() 画图。

无论是文本，图形还是表格，计算都是在 render* 函数中完成，目前有下面一些：

shiny_vars[grep("^render", shiny_vars)]
#> [1] "renderDataTable" "renderImage"     "renderPage"      "renderPlot"     
#> [5] "renderPrint"     "renderReactLog"  "renderTable"     "renderText"     
#> [9] "renderUI"

这个例子我们只需要调用 renderPlot() 。

server = function(input, output){
    output$plot = renderPlot({
        set.seed(input$seed)
        mat = sapply(seq_len(input$paths), function(i){
            sde::GBM(input$start,
                     input$r,
                     input$sigma,
                     1,
                     input$periods)
        })
        
        matplot(mat, type = "l", lty = 1, main = "Geometric Brownian motions")
    })
}

然后创建并运行 shiny ：

app = shinyApp(ui, server)
runApp(app)

效率提升

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

大话数据结构

程杰 / 清华大学出版社 / 2011-6 / 59.00元

本书为超级畅销书《大话设计模式》作者程杰潜心三年推出的扛鼎之作！以一个计算机教师教学为场景，讲解数据结构和相关算法的知识。通篇以一种趣味方式来叙述，大量引用了各种各样的生活知识来类比，并充分运用图形语言来体现抽象内容，对数据结构所涉及到的一些经典算法做到逐行分析、多算法比较。与市场上的同类数据结构图书相比，本书内容趣味易读，算法讲解细致深刻，是一本非常适合自学的读物。本书以一个计算机教师教......一起来看看《大话数据结构》这本书的介绍吧!

码农工具

效率提升

Rmarkdown

嵌入表格和图表

嵌入交互图

创建Shiny交互式应用程序

大话数据结构

Markdown 在线编辑器

正则表达式在线测试

HEX HSV 转换工具