PostgreSQL的最佳特性 你用了吗?

SQL语句通常不是很容易理解,特别是你阅读别人已经写好的语句。因此,很多人指出我们应该遵循在其他语言中遵循的原则,像加上注释和功能模块化。 我***注意到一个很多人都没有使用的Postgres关键特性,也就是 @timonk在AWS Re:Invent 大会关于数据仓库服务Redshift主题演讲时指出的一个特性。这个特性实际上使得SQL兼具了可读性和模块性。在以前,我回头阅读自己的几个月前的 SQL语句,通常很难理解,而现在我可以做到这一点。

这个特性就是CTEs,也就是公用表表达式,你有可能称做它为WITH 语句。和数据库中视图一样,它的主要好处就是,它允许你在当前事务中创建临时表。你可以大量使用它,因为它允许你思路清晰的构建模块,别人很容易就理解你在做什么。

让我们举个简单的例子

  1. WITH users_tasks AS ( 
  2.   SELECT 
  3.          users.email, 
  4.          array_agg(tasks.nameas task_list, 
  5.          projects.title 
  6.   FROM 
  7.        users, 
  8.        tasks, 
  9.        project 
  10.   WHERE 
  11.         users.id = tasks.user_id 
  12.         projects.title = tasks.project_id 
  13.   GROUP BY 
  14.            users.email, 
  15.            projects.title 

通过这样定义临时表users_tasks,我就可以在后面加上对users_tasks基本查询语句,像:

  1. SELECT * 
  2. FROM users_tasks; 

有趣的是你可以将它们连在一起。当我知道分配给每个用户的任务量时,也许我想知道在一个指定的任务上,谁因为对这个任务负责超过了50%而因此造成瓶颈。为了简化,我们可以使用多种方式,先计算每个任务的总量,然后是每人针对每个任务的负责总量。

  1. total_tasks_per_project AS ( 
  2.   SELECT 
  3.          project_id, 
  4.          count(*) as task_count 
  5.   FROM tasks 
  6.   GROUP BY project_id 
  7. ), 
  8.   
  9. tasks_per_project_per_user AS ( 
  10.   SELECT 
  11.          user_id, 
  12.          project_id, 
  13.          count(*) as task_count 
  14.   FROM tasks 
  15.   GROUP BY user_id, project_id 
  16. ), 

现在我们将组合一下然后发现超过50%的用户

  1. overloaded_users AS ( 
  2.   SELECT tasks_per_project_per_user.user_id, 
  3.   
  4.   FROM tasks_per_project_per_user, 
  5.        total_tasks_per_project 
  6.   WHERE tasks_per_project_per_user.task_count > (total_tasks_per_project / 2) 

最终目标,我想获得超负荷工作这的用户和任务的逗号分隔列表。我们只要简单地对overloaded_users和 users_tasks的初始列表进行join操作。放在一起可能有点长,但是可读性强。作为额外帮助,我又在每一层加了注释。

  1. --- Created by Craig Kerstiens 11/18/2013 
  2. --- Query highlights users that have over 50% of tasks on a given project 
  3. --- Gives comma separated list of their tasks and the project 
  4.   
  5. --- Initial query to grab project title and tasks per user 
  6. WITH users_tasks AS ( 
  7.   SELECT 
  8.          users.id as user_id, 
  9.          users.email, 
  10.          array_agg(tasks.nameas task_list, 
  11.          projects.title 
  12.   FROM 
  13.        users, 
  14.        tasks, 
  15.        project 
  16.   WHERE 
  17.         users.id = tasks.user_id 
  18.         projects.title = tasks.project_id 
  19.   GROUP BY 
  20.            users.email, 
  21.            projects.title 
  22. ), 
  23.   
  24. --- Calculates the total tasks per each project 
  25. total_tasks_per_project AS ( 
  26.   SELECT 
  27.          project_id, 
  28.          count(*) as task_count 
  29.   FROM tasks 
  30.   GROUP BY project_id 
  31. ), 
  32.   
  33. --- Calculates the projects per each user 
  34. tasks_per_project_per_user AS ( 
  35.   SELECT 
  36.          user_id, 
  37.          project_id, 
  38.          count(*) as task_count 
  39.   FROM tasks 
  40.   GROUP BY user_id, project_id 
  41. ), 
  42.   
  43. --- Gets user ids that have over 50% of tasks assigned 
  44. overloaded_users AS ( 
  45.   SELECT tasks_per_project_per_user.user_id, 
  46.   
  47.   FROM tasks_per_project_per_user, 
  48.        total_tasks_per_project 
  49.   WHERE tasks_per_project_per_user.task_count > (total_tasks_per_project / 2) 
  50.   
  51. SELECT 
  52.        email, 
  53.        task_list, 
  54.        title 
  55. FROM 
  56.      users_tasks, 
  57.      overloaded_users 
  58. WHERE 
  59.       users_tasks.user_id = overloaded_users.user_id 

CTEs通常不如经过精简优化过的SQL语句性能高。大多数差距小于一倍差距。对我而言,这种为了可读性作出的折中是毋庸置疑的。Postgres优化器以后肯定会针对这点变的更好。

多说一句,是的我可以用大约10-15行简短的SQL语句做同样的事情,但是你也许不能很快的理解它。当你碰到需要保证SQL做正确的事情时,可读性的优势就出来了。SQL语句总是有个结果,你对此毫无疑问。确保你SQL语句容易推理是保证正确性的关键。

原文链接:http://www.craigkerstiens.com/2013/11/18/best-postgres-feature-youre-not-using/

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/233582.html<

(0)
运维的头像运维
上一篇2025-04-20 16:56
下一篇 2025-04-20 16:58

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注