您当前的位置:首页 > 养生 > 内容

认识与使用AM、PM,认识与使用教学媒体思维导图(R 数据处理<五>)

关于【认识与使用AM、PM】,认识与使用教学媒体思维导图,今天犇涌小编给您分享一下,如果对您有所帮助别忘了关注本站哦。

内容导航:1、认识与使用AM、PM2、R 数据处理(五)

1、认识与使用AM、PM

AM、PM是什么?怎么使用AM、PM?小编来告诉你,请看下文。

操作方法

AM、PM是什么?AM和PM表示时间,AM表示的是午夜12点到中午12点的这段时间,而PM表示的是中午12点到午夜12点的这段时间。

怎么使用AM、PM?时间是24小时制的,我们将下午3点表示为15点,但是如果用AM和PM表示的话,下午3点就是3:00PM,而不是15PM,用AM和PM表示时间的话,时间的数字是不超过12的。

有些人会疑惑,午夜12点到底是12:00AM,还是12:00PM呢?午夜12点是12:00AM,中午12点才是12:00PM。

当我们表示从早上9点到晚上8点这段时间时,正确的写法应该是9:00AM-8:00PM,而不是9:00AM-20:00PM。

声明:本篇经验系酷知网「www.coozhi.com」原创,转载请注明出处。

2、R 数据处理(五)

前言

前面我们讲到了readr的解析器,总共有8个解析函数。

下面我们具体介绍每个解析函数的用法

解析器

1. 数值

对数值的解析看起来挺简单的,但其实有几个问题需要解决:

世界上不同地区的人写数字的方式会有所不同,比如,一些国家使用.来区分实数的整数部分和小数部分,而其他国家使用,来区分数字在不同的使用场景会被不同的字符包裹,比如$100010%数字通常包含分组字符,方便阅读。例如1,000,000

为了解决第一个问题,readr提供了locale参数来指定不同地区的解析方式。

解析数字时,最重要的选项是用于小数点的字符,你可以设置新的locale并指定decimal_mark参数的值来覆盖默认的.

>parse_double("1.23")[1]1.23>parse_double("1,23",locale=locale(decimal_mark=","))[1]1.23

parse_number()用于解决第二个问题:它会忽略数字前后的非数字字符,这对货币和百分比数字特别有用,但也适用于提取文本中嵌入的数字

>parse_number("$100")[1]100>parse_number("20%")[1]20>parse_number("Itcost$123.45")[1]123.45

最后一个问题可以通过结合parse_number()locale来忽略分组标记

#UsedinAmerica>parse_number("$123,456,789")[1]123456789#UsedinmanypartsofEurope>parse_number("123.456.789",locale=locale(grouping_mark="."))[1]123456789#UsedinSwitzerland>parse_number("123'456'789",locale=locale(grouping_mark="'"))[1]123456789

2. 字符串

parse_character()来解析字符串看起来应该是很简单的,能够直接把输入返回。

但是,生活并不是那么简单的,因为同一个字符串的表示方法有很多种。

为了理解解析时发生了,我们需要深入了解计算机如何来表示字符串的。在R中,我们可以使用charToRaw()获得字符串的底层表示形式

>charToRaw("Hadley")[1]4861646c6579

每个十六进制数代表一个字节的信息,48表示H,61表示a等等。从十六进制数到字符的映射称为编码,在这种情况下编码称为ASCII

ASCII在表示英语字符方面做得很好,因为它是美国信息交换的标准代码

而对于非英文来说,事情就变得更加复杂了点。在计算机早期时代,有许多编码非英语字符的竞争标准,要正确解释一个字符串,您需要同时知道值和编码

例如,两种常见的编码Latin1(ISO-8859-1,用于西欧语言)和Latin2(ISO-8859-2,用于东欧语言)。在Latin1中,字节b1表示±,但是在Latin2中表示的是ą

幸运的是,现在有一个标准几乎在所有地方都能够得到支持:UTF-8UTF-8可以编码当今人类使用的几乎所有字符,以及许多额外的符号(比如emoji

readr使用的都是UTF-8,它假设您的数据在读取时是UTF-8编码的,并且在写入时也总是使用它。

如果你的系统不支持UTF-8格式(你的机子不会老到这种程度的),那它看起来可能非常奇怪,已经发生了乱码。

看个例子

>x1<-"ElNi\xf1owasparticularlybadthisyear">x2<-"\x82\xb1\x82\xf1\x82\xc9\x82\xbf\x82\xcd">x1[1]"ElNi\xf1owasparticularlybadthisyear">x2[1]"\x82\xb1\x82\xf1\x82\u0242\xbf\x82\xcd"

非英文字符并未被正确转译

使用parse_character()指定编码格式

parse_character(x1,locale=locale(encoding="Latin1"))#>[1]"ElNiñowasparticularlybadthisyear"parse_character(x2,locale=locale(encoding="Shift-JIS"))#>[1]"こんにちは"

那如果我们不知道字符串的编码方式,要如何解码出正确的字符呢?

如果幸运的话,它会在数据文档中的某个地方。不幸的是,这种情况很少发生,因此readr提供了guess_encoding()来帮助您解决这个问题

它也并不是万无一失的,当你有大量的文本时效果会更好,但它是一个合理的起点。在找到合适的编码之前,可以尝试几种不同的编码。

>guess_encoding(charToRaw(x1))#Atibble:2x2encodingconfidence<chr><dbl>1ISO-8859-10.462ISO-8859-90.23>guess_encoding(charToRaw(x2))#Atibble:1x2encodingconfidence<chr><dbl>1KOI8-R0.42

guess_encoding()的第一个参数可以是文件的路径,也可以是字符串的原始向量

3. 因子

R 使用因子来表示一组所有可能值已知的分类变量。

通过向parse_factor()levels参数传入一个已知的向量作为分类向量,当出现意外的值时会生成警告信息

>fruit<-c("apple","banana")>parse_factor(c("apple","banana","bananana"),levels=fruit)Warning:1parsingfailure.rowcolexpectedactual3--valueinlevelsetbananana[1]applebanana<NA>attr(,"problems")#Atibble:1x4rowcolexpectedactual<int><int><chr><chr>13NAvalueinlevelsetbanananaLevels:applebanana

4. 时间和日期

你可以根据需要从三个解析器中选择相应的解析器

parse_datetime():ISO8601格式的日期和时间,ISO8601是一个国际标准,其中日期的组成部分按从大到小的顺序排列:年、月、日、时、分、秒

[1]"2010-10-0120:10:00UTC">parse_datetime("20101010")[1]"2010-10-10UTC"parse_date(): 接受 4位数的年份yyyy-mm-ddyyyy/mm/dd

>parse_date("2010-10-01")[1]"2010-10-01"parse_time(): 接受格式 hh:mm(:ss am/pm)

>parse_time("01:10am")01:10:00>parse_time("20:10:01")20:10:01

如果这些默认值不适用于您的数据,您可以提供自己的日期时间格式,由以下几部分组成

Year

%Y:4位数字%y:2位数字;00-69 -> 2000-2069,70-99 -> 1970-1999

Month

%m:2位数字%b : 简写, 如 Jan%B : 全称, 如 January

Day

%d:2位数字%e : 可选的前导空格

Time

%H:0-23小时%I:0-12 小时, 必须包含 %p%p:AM/PM%M : 分钟%S : 整数秒数%OS: 实数秒数%Z : 时区%z : 相对于 UTC 的偏移, 如 +0800

Non-digits

%. : 跳过一个非数字字符%* : 跳过任意个非数字字符

示例

>parse_date("01/02/15","%m/%d/%y")[1]"2015-01-02">parse_date("01/02/15","%d/%m/%y")[1]"2015-02-01">parse_date("01/02/15","%y/%m/%d")[1]"2001-02-15"

如果%B%b使用的是非英语的月份名,你需要用locale()设置语言。

详情参见date_names_langs()中的内置语言列表,或者如果没有包含你的语言,可以用date_names()创建你自己的语言

>parse_date("1janvier2015","%d%B%Y",locale=locale("fr"))[1]"2015-01-01"

最后,是上节的思考练习。是一位读者写的,我发出来给大家参考参考

( ̄▽ ̄)~*

http://note.youdao.com/s/Ls1QE1oN

本文关键词:带表卡尺的认识与使用,理发卡尺的认识与使用,认识与使用手机,电子琴黑键认识与使用,推子卡尺的认识与使用。这就是关于《认识与使用AM、PM,认识与使用教学媒体思维导图(R 数据处理)》的所有内容,希望对您能有所帮助!


声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。

上一篇: iphone4s游戏排行榜(iphone4s好玩的游戏有哪些)

下一篇: 柏拉图式爱情什么意思,柏拉图式爱情什么意思利弊(柏拉图式的爱情是什么意思)



推荐阅读

网站内容来自网络,如有侵权请联系我们,立即删除! | 软文发布 | 粤ICP备2021106084号