본문 바로가기
R/R 기본

[R 2] 변수와 연산자

by 자유데이터 2018. 11. 13.
반응형


1.변수

(변수 명) (연산자) (값) 으로 표현된다.

변수명은 알파벳, 숫자, 언더스코어( _ ), 마침표로 구성할 수 있고 하이픈은 사용할 수 없다.
첫 글자에는 알파벳, 마침표로 시작해야하고 마침표 시작일때는 뒤에 숫자가 올 수 없다.
연산자는 <- , <<- , = 를 사용한다.
= 는 명령의 최상위 수준에 적용이 된다.  mean( x = c(1,2,3)) 인 경우 x는 생성되지 않는다.

ex)
a <- 1
b1 <<- 2
.c = 3



2.연산자와 기본 규칙

+ - / *  사칙연산
^         제곱( ** 같은 표현)
%/%     몫
%%      나머지

TRUE, FALSE 진리값은 반드시 대문자로 사용해야 하며 T,F로 표현하기도 한다.
&&는 두 개의 진리값끼리 연산을 하기 위한 연산자로 한 개의 값만 반환된다.

ex)
> c(TRUE,FALSE) & c(TRUE,TRUE)
[1] TRUE FALSE

> c(TRUE,FALSE) && c(TRUE,TRUE)
[1] TRUE

문자열은 ' ' , " " 둘 다 된다.
띄어쓰기는 언더스코어( _ )로 표현한다.



3.NA(결측치)와 NULL
결측치는 측정되지 못한 값이란 뜻으로, 어떤 이유로든 관찰되지 못한 경우를 말한다.
NULL은 프로그래밍의 편의를 위해 미정된 값을 표현하는 데 사용하는 개념이다.

is.na()is.null() 함수로 값이 있는지 판단할 수 있다.
is.~ 는 논리값 형태로 반환한다.



4.Factor 함수
Factor는 범주형 데이터를 표현하기 위한 함수이다.

-연속형 데이터 : 두 값 사이에 무수히 많은 값이 존재할 수 있는 데이터를 말한다.

-범주형 데이터 : 사전에 정해진 특정 유형으로 분류되는 데이터를 말한다. ( ex:대 중 소 )
-순서형 : 순서가 있는 범주형 데이터를 말한다. ( ex: 나이)
-명목형 : 순서가 없는 범주형 데이터를 말한다. 즉, 크기 비교가 불가능하다. ( ex:남 녀)

ex)남자 여자
> gender <- factor( "m" , c( "m" , "f" ))
> gender
[1] m
Levels: m f

> nlevels(gender)        #factor의 레벨 개수
[1] 2

> levels(gender)          #factor의 레벨 목록
[1] "m" "f"

> levels(gender)[1]       #인덱스가 0이 아닌 1부터 시작한다.
[1] "m"

> levels(gender)[2]
[1] "f"

> ordered("a" , c("a" , "b" , "c" )    #순서형 factor를 생성한다.
[1] a
Levels: a < b< c




5.또 다른 함수들

mean()   평균 구하는 함수
max()     최대값 구하는 함수
min()      최소값 구하는 함수

paste()
: 벡터의 셀들을 합처준다.

ex)
> z <- c("Hi~", "Today", "is", "good.")
> paste(z, collapse=" / ")
[1] "Hi~/Today/is/good."
> paste(z, collapse="  ")
[1] "Hi~ Today is good."








반응형

댓글