목록분류 전체보기 (75)
SiLaure's Data
패스트캠퍼스 검색광고 데이터 분석 데이터의 구성 : 분석목표 : 중점관리 키워드, 저효율 키워드 추출 중점관리 광고그룹, 저효율 광고그룹 추출 분석과정 : 데이터 전처리 데이터 탐색 시각화 데이터분석 1. 데이터 전처리 학습목표 : read_excel함수를 사용하여 파이썬에 데이터 불러오기 데이터프레임의 열 단위 수치연산 및 데이터 타입 다루기 In [1]: import pandas as pd from pandas import DataFrame from pandas import Series In [2]: import matplotlib.pyplot as plt In [3]: # matplotlib 한글 폰트 출력코드 # 출처 : 데이터공방( https://kiddwannabe.blog.me) import..
데이터 분석 과정과 시각화 머신러닝의 과정 데이터 수집 데이터 전처리 데이터 탐색 ★ 모델 선택 모델 평가 및 적용 시각화의 필요성 대량의 데이터 파악 가능 데이터의 패턴 파악 가능 In [16]: import matplotlib.pyplot as plt In [17]: import pandas as pd from pandas import DataFrame from pandas import Series In [18]: # matplotlib 한글 폰트 출력코드 # 출처 : 데이터공방( https://kiddwannabe.blog.me) import matplotlib from matplotlib import font_manager, rc import platform try : if platform.sys..

1. 광고의 진행 과정 광고주 ---- 돈 ---> 매체(네이버 구글 등) --- 노출 --- 클릭 --- 구매 ---> 고객 1. 광고 성과 지표 CTR이 높을 수록, CPM이 낮을 수록, CPC가 낮을 수록, CPA가 낮을 수록 광고 성과가 좋다. In [4]: imp=10000 # IMPRESSION(노출) clk=100 # CLICK conv=10 #CONVERSION(구매) cost=100000 In [7]: # ctr ctr = clk/imp *100 In [8]: #ctr 출력 ctr Out[8]: 1.0 In [9]: # cpm cpm = cost/imp *1000 In [11]: #cpm 출력 cpm Out[11]: 10000.0 In [12]: # cpc cpc = cost/clk In..

About ... 데이터 처리 How-To 기술 통계량 추출 - 평균, 중앙값, 최빈값, 분산, 표준편차, 4 분위, 최솟값, 최댓값 기술 통계량을 사용한 분석 - Pandas, Matplotlib Python 기본기 갖추기 - 머신러닝과 딥러닝을 진행하기 위한 기본 조건 마테킹 현업에서 각광받고 있는 파이썬 1. 대량 데이터 분석 능력 요구 - 대량 데이터 처리에 한계가 있는 Excel - 실습 예제 1 : 1,381행, 7열 - 실습 예제 2 : 41,188행, 21열 2. 광고주가 요구하는 데이터 분석 수준 증대 - 과거 : 클릭 수, 노출 수의 단순 마케팅 데이터 분석 - 현재 : 직업, 성별, 관심사, 통화시간, 결혼여부, 결제 방법 등 다양한 데이터 분석 요구 3. 배우기 쉽고 데이터 분석에 ..

1. 아키텍처란(Architecture) 1. 시스템을 만들기 위한 물리 레벨의 조합 (서버의 기능, 저장소와 네트워크 기기의 결합 등) 2. 데이터베이스 설계에서 시스템의 구성 3. 아키텍처를 통해 시스템의 용도나 목적을 추측 가능 - IT 아키텍처 : 일정 기준과 절차에 따라 조직 전체와 정보화 구성요소를 통합 분석 후, 그 관계를 구조적으로 정리한 체제, 이를 바탕으로 정보 시스템을 효율적으로 구성하기 위한 방법 아키텍처의 구성을 시스템의 목적에 맞게 결정하는 과정 서버, OS, 미들웨어, 저장소 등 폭넓은 지식 필요 적정 비용으로 필요시스템을 구축하기 위해서도 매우 중요 2. 아키텍처 역사와 개요 Stand-Alone 1980년대까지 널리 이용 데이터베이스만으로 시스템 운용 Client/Serve..

1. 관계형 데이터베이스 2차원 표, 목록(Excel, Google SpreadSheet) Key와 Value들의 간단한 관계를 테이블화 한 것 - 관계형 모델 : 집합론에 기반을 둔 데이터베이스 모델 하나 이상의 테이블 존재, 테이블에 정보 저장. 각각의 로우(행)을 식별하는 기본키가 잆음(Primary Key) 행 : 컬럼(Column), 필드(Field), 속성(Attribute) 열 : 로우(Row), 레코드(Record), 튜플(Tuple) 2. SQL 기초 지식 - SQL(Structured Qurery Language) : DBMS의 데이터를 관리하기 위해 설계된 프로그래밍 언어(관계형 DBMS) - 장점 일반 프로그래밍 언어에 비해 간결하다. 간단한 영어 문장 사용 기본 조작 명령어(Sel..
데이터 베이스 사용 이전 텍스트 파일 형태, 비효율적, 각자 관리한 후 공유하는 방식 데이터 베이스 한곳에서 여러 사용자가 관리, 대용량, 모든 유형의 파일 관리 가능 DBMS 데이터 베이스를 관리, DBMS - 특징 실시간 접근성(real time accessibility) : 성능과 연관 계속적인 변화(continous change) 동시 공유(concurrent sharing) : 여러 사용자 내용에 따른 참조(reference by content) : 물리적 위치가 아닌 내용에 따라 참조 - 기능 삽입, 삭제, 수정, 조회(갱신/조회) 동시성 제어 장애 대응(복원) 보안(서버 내에서만 관리하여 보안에 위배되지 않는 데이터 조회가 가능) DBMS 종류 저장 방식에 따라 계층형 : 계층 구조로 데이터..