목록분류 전체보기 (75)
SiLaure's Data
- 소개 · (프로그래밍)을 (파이썬)으로 하는 것 - 프로그래밍이란? · 컴퓨터에게 일을 시키는 방법 · 컴퓨터에게 명령을 내리는 방법 · 명령을 내리는 일련의 과정 · 결과로 하나의 과정을 수행하는 프로그램이 생성 · 컴퓨터에게 코드로 명령하여 일을 시키는 과정 - COMPUTER ARCHITECTURE 컴퓨터 구조 · CPU : 모든 처리, 계산 => instructions · DRAM(메인 메모리) : 처리 중간에 CPU와 함께 일을 수행 => program · SSD, HDD(스토리지) : 모든 데이터 저장 => files - PROGRAMMING LANGUAGE 프로그래밍 언어 · 컴퓨터에게 일을 시키는 도구 · 컴퓨터와 사람이 소통할 수 있는 방법 · (프로그래밍)언어 · 언어마다 각자 다른..
1. Application(MS Excel) · 손쉽게 데이터 분석을 시작할 수 있다. · GUI(Graphic User Interface)를 이용하여 그래프, 통계자료 등을 직관적으로 볼 수 있다. · 실제 업무에서 사용하는 유저가 많다. · 대용량 데이터에 취약하다.(100,000rows 이상) · 엑셀이 제공하지 않는 기능은 사용할 수 없다. e.g. 머신러닝, 서버 구성, ··· 2. Programming with Python(Pandas) · 대용량 데이터도 손쉽게 다룰 수 있다. · 머신러닝, 서버 배포 등 원하는 기능들과 함께 구현할 수 있다. · 학습의 난이도가 엑셀에 비해 높다. · GUI 환경이긴 하지만 엑셀만큼 직관적이진 않다. - 올바른 데이터 분석도구의 선택 · 분석 목적을 확실히..

- BIG DATA의 특징 4V : Volume, Variety, Velocity, Veracity · peta 단위의 데이터가 있어야 빅데이터라고 한다. · 데이터의 속도. streaming data. e.g) YouTube 등 - 데이터는 정형데이터, 비정형 데이터로 나뉜다. Q1. 대용량 고객거래 데이터를 파악하면 어떤 것들을 알 수 있을까? Q2. 고객거래 데이터가 엄청나게(peta-scale)로 많아지면 어떤 문제가 생길까? Q3. 대용량 SNS 데이터를 파악하면 어떤 것들을 알 수 있을까? Q4. SNS 데이터는 실시간으로 엄청나게 많이 생성되는데, 이런 데이터를 관리하려면 어떻게 해야할까? - 빅데이터의 정의 1. 기존의 데이터베이스 시스템으로는 저장, 관리 분석하기 어렵다, 비싸다. 2. ..