R 是一种开源编程语言,被广泛用作统计软件和数据分析工具。R 通常带有命令行界面。R 可在 Windows、Linux 和 macOS 等广泛使用的平台上使用。此外,R 编程语言是最新的尖端工具。

它由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 设计,目前由 R Development Core Team 开发。R 编程语言是 S 编程语言的一种实现。它还结合了受 Scheme 启发的词法作用域语义。此外,该项目构思于 1992 年,1995 年发布了初始版本,2000 年发布了稳定的测试版。

为什么选择 R 编程语言?

  • R 编程被用作机器学习、统计和数据分析的主要工具。R 可以轻松地创建对象、函数和包。
  • 它是一种独立于平台的语言。这意味着它可以应用于所有操作系统。
  • 它是一种开源的免费语言。这意味着任何人都可以在任何组织中安装它,而无需购买许可证。
  • R 编程语言不仅是一个统计包,还允许我们与其他语言(C、C++)集成。因此,您可以轻松地与许多数据源和统计包进行交互。
  • R 编程语言拥有庞大的用户社区,并且每天都在增长。
  • R 目前是数据科学就业市场上最受欢迎的编程语言之一,这使其成为当今最热门的趋势。

R 编程语言的特点

R 的统计特征

基本统计:最常见的基本统计术语是均值、众数和中位数。这些都被称为“中央趋势措施”。所以使用 R 语言我们可以很容易地测量集中趋势。
静态图形: R 具有丰富的工具来创建和开发有趣的静态图形。R 包含许多绘图类型的功能,包括图形地图、马赛克绘图、双绘图,并且列表还在继续。
概率分布:概率分布在统计学中起着至关重要的作用,通过使用 R,我们可以轻松处理各种类型的概率分布,例如二项式分布、正态分布、卡方分布等等。
数据分析:它为数据分析提供了一个庞大的、连贯的和集成的工具集合。

R 的编程特点

R 包:R 的主要功能之一是它具有广泛的库。R 有 CRAN(Comprehensive R Archive Network),它是一个包含 10、0000 多个包的存储库。
分布式计算:分布式计算是一种模型,其中软件系统的组件在多台计算机之间共享以提高效率和性能。用于 R 中分布式编程的两个新包ddR 和 multidplyr于 2015 年 11 月发布。

在 R 中编程

由于 R 在语法上与其他广泛使用的语言非常相似,因此在 R 中编码和学习更容易。程序可以在任何广泛使用的 IDE(如 R StudioRattleTinn-R 等)中用 R 编写。程序使用扩展名 .r 保存文件。要运行该程序,请在命令行上使用以下命令:

1
R file_name.r

例子:

1
2
3
4
# R program to print Welcome to haiyong.site!

# Below line will print "Welcome to haiyong.site!"
cat("Welcome to haiyong.site!")

输出:

1
Welcome to haiyong.site!

R 的优点

  • R 是最全面的统计分析包。由于新技术和概念通常首先出现在 R 中。
  • 由于 R 编程语言是开源的。因此,您可以随时随地运行 R。
  • R 编程语言适用于 GNU/Linux 和 Windows 操作系统。
  • R 编程是跨平台的,可以在任何操作系统上运行。
  • 在 R 中,欢迎大家提供新的包、错误修复和代码增强。

R 的缺点

  • 在 R 编程语言中,一些包的标准并不完美。
  • 虽然,R 命令给内存管理带来的压力很小。所以 R 编程语言可能会消耗所有可用的内存。
  • 基本上,在 R 中,如果某些东西不起作用,没有人会抱怨。
  • R 编程语言比 Python 和 MATLAB 等其他编程语言慢得多。

R 的应用

  • 我们将 R 用于数据科学。它为我们提供了大量与统计相关的库。它还为统计计算和设计提供了环境。
  • 许多定量分析师使用 R 作为其编程工具。因此,它有助于数据导入和清理。
  • R 是最流行的语言。如此多的数据分析师和研究程序员使用它。因此,它被用作金融的基本工具。
  • 如今,Google、Facebook、bing、Twitter、Accenture、Wipro 等科技巨头都在使用 R。

R 和 Python 在数据科学中都扮演着重要角色。对于任何新手来说,在 R 和 Python 两者中选择更好或更合适的一个会变得很困惑。接下来的一篇文章我会介绍:R vs Python 选择哪种语言更适合数据科学。