Data Engineering
-
BoA(Bank of America) 모바일서비스 '에리카'Data Engineering 2024. 6. 10. 18:18
https://www.samsungsds.com/kr/insights/ai-in-telecom-and-finance.html 통신과 금융산업에서 AI 서비스가 필수인 이유 | 인사이트리포트 | 삼성SDS통신과 금융산업은 첨단 기술을 사용하면서도 운영 안정성이 어떠한 가치보다 중요한 산업입니다. 고객 경험을 구축하기 위한 핵심적인 요소는 기술 그 자체가 아닌 신뢰할 수 있는 기술과 디www.samsungsds.com 기존은행이었던 (핀테크기업이 아닌 기존은행) 뱅크오브아메리카가 단순 계좌조회 뿐만 아니라 송금, 대출연장, 이자상환 등 기존 상담원 업무까지 처리가 가능한 '에리카'라는 앱을 서비스하는데, 인생 재무설계를 조언하고 상담하는 라이프플랜을 제공하고 재무 목표를 정하고 성취할 수 있도록 돕는 도구..
-
SQL: Bind VariableData Engineering 2023. 12. 8. 15:41
Create Table CREATE TABLE ch13_physicist( ids NUMBER, names VARCHAR2(20), birth_dt DATE); Declare vn_emp_id employees.employee_id%type; vn_emp_name employees.emp_name%TYPE; vn_job_id employees.job_id%TYPE; vs_job employees.job_id%TYPE := 'SA_REP' vn_sal employees.salary%TYPE := 7000; vn_manager employees.manager%TYPE := 148; vs_sql VARCHAR2(1000); Select Using Bind Variables BEGIN vs_sql := 'INS..
-
Oracle StatisticsData Engineering 2023. 11. 14. 16:57
Optimizer가 CBO 계산시 활용하는 통계정보 데이터 확인법 1. 테이블 통계 select TABLE_NAME, NUM_ROWS, BLOCKS, EMPTY_BLOCKS, AVG_SPACE, AVG_ROW_LEN, AVG_SPACE_FREELIST_BLOCKS , NUM_FREELIST_BLOCKS, SAMPLE_SIZE, LAST_ANALYZED from dba_tables where owner='SCOTT' 2. 인덱스 통계 select INDEX_NAME, BLEVEL, LEAF_BLOCKS, CLUSTERING_FACTOR , NUM_ROWS, DISTINCT_KEYS, AVG_LEAF_BLOCKS_PER_KEY , AVG_DATA_BLOCKS_PER_KEY, SAMPLE_SIZE, LAST_..
-
데이터 중심 애플리케이션 설계 2장Data Engineering 2022. 2. 21. 17:58
1. 데이터 모델 - 다양한 유형의 데이터 모델이 있고 각 데이터 모델은 사용 방법에 대한 가정이 있다. 즉 어떤 동작은 쉽고 어떤 연산은 빠르고 다른 연산은 느리고, 어떤 데이터 변환은 자연스럽고 어떤 데이터 변환은 부자연스럽다. - 하나의 데이터 모델을 완전히 익히는 것도 어려운 일이다. 그러나 데이터 모델은 그 위에서 소프트웨어가 할 수 있는 일과 할 수 없는 일에 많은 영향을 주므로 애플리케이션에 적합한 데이터 모델을 선택하는 작업이 상당히 중요하다. - 관계형 데이터 모델, 문서 모델, 그래프 기반 데이터 모델(속성 그래프, 트리플 저장소 모델)을 2장에서 다룬다. 관계형 모델(SQL) - 관계(relation=sql에서 table)로 구성되고 각 관계는 순서없는 튜플(tuple, sql = r..
-
gitData Engineering 2022. 2. 16. 17:40
사용 툴 : vs code/ sourcetree git add . git commit -m "commit message" --> git commit -am "commit message" #위 두가지 한번에 , 단 새로 추가된 untracked(U) 파일 없어야 함 git diff git log ** 되돌리기 (reset, revert) reset git reset --hard git reset --hard -> 폴더를 commit한 타임캡슐 상태로 되돌림 **branch git branch # branch 생성 git branch #branch 목록 확인 git switch #branch로 switch git switch -c new-teams #브랜치 생성과 동시에 이동하기 **branch 내역 gra..
-
DruidData Engineering 2022. 2. 8. 22:33
분석 엔진(OLAP), 빠르다. 특정 요건에 따라 count나 sum 등 데이터를 마는 작업의 결과물 빠르게 내는 엔진이다. 반정형/정형 데이터에서만 사용 가능. 실시간으로 빨리 사용자에게 보여줘야 되는 경우에 사용한다. 타임라인(시계열)데이터에 강하다. airbnb에서 사용중인데, 내 생각에는 객실 n개 남았습니다 표시할 때 로그 뒤져서 해당 객실 예약완료 로그 찾아내서 rollup하는게 아닐까 싶다. 내가 하게 될 프로젝트에는 어떤 경우에 사용할 수 있을까?를 생각해보면 통신사 데이터 대시보드 구성할 때가 떠오른다. 이전에 하던 프로젝트에서 조건에 맞는 고객 수 count를 실시간으로 빠르게 해야하는 경우가 있었는데 그때 이런 빠른 olap 엔진을 썼으면 더 좋지 않았을까 생각해 본다. 왜 다른 분들..