Query optimization in microsoft SQL server PDW

Authors:
Srinath Shankar;Rimma Nehme;Josep Aguilar-Saborit;Andrew Chung;Mostafa Elhemali;Alan Halverson;Eric Robinson;Mahadevan Sankara Subramanian;David DeWitt;César Galindo-Legaria
Affiliations:
Microsoft Corporation, Madison, WI, USA;Microsoft Corporation, Madison, WI, USA;Microsoft Corporation, Aliso VIejo, CA, USA;Microsoft Corporation, Aliso Viejo, CA, USA;Microsoft Corporation, Redmond, WA, USA;Microsoft Corporation, Madison, WI, USA;Microsoft Corporation, Madison, USA;Microsoft Corporation, Aliso Viejo, CA, USA;Microsoft Corporation, Madison, WI, USA;Microsoft Corporation, Redmond, WA, USA
Venue:
SIGMOD '12 Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data
Year:
2012

Citing 6
Cited 2

System R: relational approach to database management

ACM Transactions on Database Systems (TODS)
The Volcano Optimizer Generator: Extensibility and Efficient Search

Proceedings of the Ninth International Conference on Data Engineering
Optimization of Parallel Query Execution Plans in XPRS

Optimization of Parallel Query Execution Plans in XPRS
Unit-testing query transformation rules

Proceedings of the 1st international workshop on Testing database systems
The Picasso database query optimizer visualizer

Proceedings of the VLDB Endowment
Automated partitioning design in parallel database systems

Proceedings of the 2011 ACM SIGMOD International Conference on Management of data

Split query processing in polybase

Proceedings of the 2013 ACM SIGMOD International Conference on Management of Data
Designing query optimizers for big data problems of the future

Proceedings of the VLDB Endowment

Quantified Score

Hi-index	0.00

Visualization

Abstract

In recent years, Massively Parallel Processors have increasingly been used to manage and query vast amounts of data. Dramatic performance improvements are achieved through distributed execution of queries across many nodes. Query optimization for such system is a challenging and important problem. In this paper we describe the Query Optimizer inside the SQL Server Parallel Data Warehouse product (PDW QO). We leverage existing QO technology in Microsoft SQL Server to implement a cost-based optimizer for distributed query execution. By properly abstracting metadata we can readily reuse existing logic for query simplification, space exploration and cardinality estimation. Unlike earlier approaches that simply parallelize the best serial plan, our optimizer considers a rich space of execution alternatives, and picks one based on a cost-model for the distributed execution environment. The result is a high-quality, effective query optimizer for distributed query processing in an MPP.