认识与使用AM、PM，认识与使用教学媒体思维导图（R 数据处理<五>）-全百科

关于【认识与使用AM、PM】，认识与使用教学媒体思维导图，今天犇涌小编给您分享一下，如果对您有所帮助别忘了关注本站哦。

内容导航：1、认识与使用AM、PM2、R 数据处理（五）

1、认识与使用AM、PM

AM、PM是什么？怎么使用AM、PM？小编来告诉你，请看下文。

操作方法

AM、PM是什么？AM和PM表示时间，AM表示的是午夜12点到中午12点的这段时间，而PM表示的是中午12点到午夜12点的这段时间。

怎么使用AM、PM？时间是24小时制的，我们将下午3点表示为15点，但是如果用AM和PM表示的话，下午3点就是3：00PM,而不是15PM，用AM和PM表示时间的话，时间的数字是不超过12的。

有些人会疑惑，午夜12点到底是12：00AM，还是12：00PM呢？午夜12点是12：00AM,中午12点才是12：00PM。

当我们表示从早上9点到晚上8点这段时间时，正确的写法应该是9：00AM-8：00PM，而不是9：00AM-20：00PM。

声明：本篇经验系酷知网「www.coozhi.com」原创，转载请注明出处。

2、R 数据处理（五）

前言

前面我们讲到了readr的解析器，总共有8个解析函数。

下面我们具体介绍每个解析函数的用法

解析器

1. 数值

对数值的解析看起来挺简单的，但其实有几个问题需要解决：

世界上不同地区的人写数字的方式会有所不同，比如，一些国家使用.来区分实数的整数部分和小数部分，而其他国家使用,来区分数字在不同的使用场景会被不同的字符包裹，比如$1000，10%数字通常包含分组字符，方便阅读。例如1,000,000

为了解决第一个问题，readr提供了locale参数来指定不同地区的解析方式。

解析数字时，最重要的选项是用于小数点的字符，你可以设置新的locale并指定decimal_mark参数的值来覆盖默认的.

>parse_double("1.23")[1]1.23>parse_double("1,23",locale=locale(decimal_mark=","))[1]1.23

parse_number()用于解决第二个问题：它会忽略数字前后的非数字字符，这对货币和百分比数字特别有用，但也适用于提取文本中嵌入的数字

>parse_number("$100")[1]100>parse_number("20%")[1]20>parse_number("Itcost$123.45")[1]123.45

最后一个问题可以通过结合parse_number()和locale来忽略分组标记

#UsedinAmerica>parse_number("$123,456,789")[1]123456789#UsedinmanypartsofEurope>parse_number("123.456.789",locale=locale(grouping_mark="."))[1]123456789#UsedinSwitzerland>parse_number("123'456'789",locale=locale(grouping_mark="'"))[1]123456789

2. 字符串

用parse_character()来解析字符串看起来应该是很简单的，能够直接把输入返回。

但是，生活并不是那么简单的，因为同一个字符串的表示方法有很多种。

为了理解解析时发生了，我们需要深入了解计算机如何来表示字符串的。在R中，我们可以使用charToRaw()获得字符串的底层表示形式

>charToRaw("Hadley")[1]4861646c6579

每个十六进制数代表一个字节的信息，48表示H,61表示a等等。从十六进制数到字符的映射称为编码，在这种情况下编码称为ASCII。

ASCII在表示英语字符方面做得很好，因为它是美国信息交换的标准代码

而对于非英文来说，事情就变得更加复杂了点。在计算机早期时代，有许多编码非英语字符的竞争标准，要正确解释一个字符串，您需要同时知道值和编码

例如，两种常见的编码Latin1(ISO-8859-1，用于西欧语言)和Latin2(ISO-8859-2，用于东欧语言)。在Latin1中，字节b1表示±，但是在Latin2中表示的是ą。

幸运的是，现在有一个标准几乎在所有地方都能够得到支持：UTF-8。UTF-8可以编码当今人类使用的几乎所有字符，以及许多额外的符号（比如emoji）

readr使用的都是UTF-8，它假设您的数据在读取时是UTF-8编码的，并且在写入时也总是使用它。

如果你的系统不支持UTF-8格式（你的机子不会老到这种程度的），那它看起来可能非常奇怪，已经发生了乱码。

看个例子

>x1<-"ElNi\xf1owasparticularlybadthisyear">x2<-"\x82\xb1\x82\xf1\x82\xc9\x82\xbf\x82\xcd">x1[1]"ElNi\xf1owasparticularlybadthisyear">x2[1]"\x82\xb1\x82\xf1\x82\u0242\xbf\x82\xcd"

非英文字符并未被正确转译

使用parse_character()指定编码格式

parse_character(x1,locale=locale(encoding="Latin1"))#>[1]"ElNiñowasparticularlybadthisyear"parse_character(x2,locale=locale(encoding="Shift-JIS"))#>[1]"こんにちは"

那如果我们不知道字符串的编码方式，要如何解码出正确的字符呢？

如果幸运的话，它会在数据文档中的某个地方。不幸的是，这种情况很少发生，因此readr提供了guess_encoding()来帮助您解决这个问题

它也并不是万无一失的，当你有大量的文本时效果会更好，但它是一个合理的起点。在找到合适的编码之前，可以尝试几种不同的编码。

>guess_encoding(charToRaw(x1))#Atibble:2x2encodingconfidence<chr><dbl>1ISO-8859-10.462ISO-8859-90.23>guess_encoding(charToRaw(x2))#Atibble:1x2encodingconfidence<chr><dbl>1KOI8-R0.42

guess_encoding()的第一个参数可以是文件的路径，也可以是字符串的原始向量

3. 因子

R 使用因子来表示一组所有可能值已知的分类变量。

通过向parse_factor()的levels参数传入一个已知的向量作为分类向量，当出现意外的值时会生成警告信息

>fruit<-c("apple","banana")>parse_factor(c("apple","banana","bananana"),levels=fruit)Warning:1parsingfailure.rowcolexpectedactual3--valueinlevelsetbananana[1]applebanana<NA>attr(,"problems")#Atibble:1x4rowcolexpectedactual<int><int><chr><chr>13NAvalueinlevelsetbanananaLevels:applebanana

4. 时间和日期

你可以根据需要从三个解析器中选择相应的解析器

parse_datetime():ISO8601格式的日期和时间，ISO8601是一个国际标准，其中日期的组成部分按从大到小的顺序排列:年、月、日、时、分、秒

[1]"2010-10-0120:10:00UTC">parse_datetime("20101010")[1]"2010-10-10UTC"parse_date(): 接受 4位数的年份yyyy-mm-dd或yyyy/mm/dd

>parse_date("2010-10-01")[1]"2010-10-01"parse_time(): 接受格式 hh:mm(:ss am/pm)

>parse_time("01:10am")01:10:00>parse_time("20:10:01")20:10:01

如果这些默认值不适用于您的数据，您可以提供自己的日期时间格式，由以下几部分组成

Year

%Y:4位数字%y:2位数字;00-69 -> 2000-2069,70-99 -> 1970-1999

Month

%m:2位数字%b : 简写, 如 Jan%B : 全称, 如 January

Day

%d:2位数字%e : 可选的前导空格

Time

%H:0-23小时%I:0-12 小时, 必须包含 %p%p:AM/PM%M : 分钟%S : 整数秒数%OS: 实数秒数%Z : 时区%z : 相对于 UTC 的偏移, 如 +0800

Non-digits

%. : 跳过一个非数字字符%* : 跳过任意个非数字字符

示例

>parse_date("01/02/15","%m/%d/%y")[1]"2015-01-02">parse_date("01/02/15","%d/%m/%y")[1]"2015-02-01">parse_date("01/02/15","%y/%m/%d")[1]"2001-02-15"

如果%B或%b使用的是非英语的月份名，你需要用locale()设置语言。

详情参见date_names_langs()中的内置语言列表，或者如果没有包含你的语言，可以用date_names()创建你自己的语言

>parse_date("1janvier2015","%d%B%Y",locale=locale("fr"))[1]"2015-01-01"

最后，是上节的思考练习。是一位读者写的，我发出来给大家参考参考

(￣▽￣)~*

http://note.youdao.com/s/Ls1QE1oN

本文关键词：带表卡尺的认识与使用，理发卡尺的认识与使用，认识与使用手机，电子琴黑键认识与使用，推子卡尺的认识与使用。这就是关于《认识与使用AM、PM，认识与使用教学媒体思维导图（R 数据处理）》的所有内容，希望对您能有所帮助！

声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，谢谢。

认识与使用AM、PM，认识与使用教学媒体思维导图（R 数据处理<五>）