일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- kubectl
- lambda
- 성능개선
- 공매
- 매입불공제
- 산지연금
- boto3
- 농지연금
- Kubernetes
- AWS
- Resolver
- pod
- 외국납부세액공제
- Filter
- 인덱싱
- 리소스
- python
- 정책자금
- node
- S3
- 금융소득
- 세금계산서
- 임업후계자
- serverless
- 양도소득세
- 신탁공매
- OpenSearch
- command
- route53
- 경매
- Today
- Total
목록IT/databricks (2)
진지한 개발자
Delta Lake Apache Spark 기반의 오픈소스 데이터 레이크 다양한 데이터 소스와 파일 형식을 지원하며, 높은 확장성과 무결성 보장 함 주요 쿼리 1. 데이터 쓰기 from delta import * data = spark.range(0, 5) data.write.format("delta").save("/delta-table") 위 코드는 Spark DataFrame을 Delta Lake 테이블로 저장하는 예시입니다. Delta Lake는 Spark의 기본 파일 형식이 아닌 별도의 파일 형식을 사용합니다. 이를 위해 delta 포맷을 사용하여 저장합니다. 2. 데이터 읽기 from delta import * data = spark.read.format("delta").load("/delta-..
Delta Lake의 주요 장점 확장성: Delta Lake는 수많은 대규모 데이터를 처리할 수 있도록 확장성이 뛰어나며, 필요에 따라 클라우드 컴퓨팅 자원을 효율적으로 활용할 수 있음 비용 효율성: Delta Lake는 보통 저렴한 하드웨어에서 구동되며 클라우드에서 실행될 때도 비용 효율적임 데이터 유연성: Delta Lake는 다양한 데이터 유형을 처리할 수 있습니다. 특히 비정형 데이터에 강함. 데이터 무결성: Delta Lake는 여러 사용자가 동시에 데이터를 수정할 때 데이터 무결성을 보장함 다양한 포맷 지원: Delta Lake는 다양한 파일 포맷을 지원하여 유연한 데이터 처리를 가능하게 함 비정형 데이터를 처리하거나, 비용 효율성이 중요한 경우 적합 Amazon Redshift의 장점 성능:..