统计过程控制 (SPC) 是一种利用统计技术来监控和控制制造过程的方法。
我过去常常认为,如果将机器设置得极其完美,它应该能无限期地生产出完美的零件。如果尺寸出现偏差,我会立即微调设置来修复它。但事实证明,这对任何人都毫无帮助。
根据每一次测量结果不断微调机器,通常只会放大问题。
我意识到每一个过程,无论多么精确,都有其心跳(一种自然的变异节奏)。为了在不抓狂的情况下管理这一点,我们需要统计过程控制 (SPC)。
它的目的是告诉你什么时候真正偏离了航向,什么时候只是遇到了路上的一个小颠簸。
目标直截了当:效率。
通过使用 SPC,您可以确保您的过程发挥其最大潜力,生产出更多符合规格的产品,并显著减少浪费。
您不再依赖昂贵的终端检测,而是开始在错误发生之前进行预防。
您可能会听到这个术语与统计质量控制 (SQC) 互换使用,或者看到它在关于质量控制的更广泛指南中被提及。
虽然它们同根同源,但 SPC 主要关注输入和活动过程,而不仅仅是最终输出。
在这篇文章中,我想帮助您建立一个关于 SPC 的坚实思维模型。我们将涵盖:
- 这些工具如何从军工厂转移到现代实验室的历史。
- “普通原因”变异与”特殊原因”变异之间的关键区别。
- 如何使用控制图(无需数学博士学位)。
- 如何在您自己的工作流程中实施这些策略。
我保证,这比看起来要容易。
目录
什么是统计过程控制?
大多数人认为质量保证就像期末考试。您制造产品,然后在生产线的最后进行检查。
如果不合格,就报废。
但坦率地说,这种做生意的方式极其昂贵。当您发现缺陷时,时间和材料已经浪费了。
统计过程控制 (SPC) 彻底颠覆了这种模式。
我们不再等待成品,而是使用统计方法来实时监控生产过程。目标是从检测(发现坏零件)转变为预防(从一开始就阻止其产生)。
这很像烤饼干。
传统的检查是在饼干出炉后尝一尝看是否烤焦了。SPC 是在烘烤时监控烤箱温度和计时器。如果温度飙升,您要在这批饼干被毁之前修复它。
SPC 和 统计质量控制 (SQC) 之间有一个棘手的区别。SQC 监控过程输出(因变量)并包括抽样检验,而 SPC 专注于控制过程输入(自变量)。SPC 不直接使用抽样检验。
为了使其发挥作用,我们需要依赖严格的质量数据。
我们从直接的产品测量和仪器读数中收集这些数据。通过统计分析这些数据,我们确保过程表现一致,从而免去生产后修正的头痛。
SPC 的历史
了解这些东西的真正来源有助于真正理解其背后的”原因”。
故事始于 20 世纪 20 年代初,贝尔实验室的一位名叫 Walter A. Shewhart 的物理学家。
他正试图解决一个棘手的问题:区分电话设备制造中的随机噪声和实际问题。
1924 年,Shewhart 写了一份备忘录,其中包含了控制图的最初草图。这就是统计控制概念的诞生。
他意识到你不能对每一个微小的变异都做出反应。
你需要一种方法透过噪音看到信号。
二战期间,风险变得更高。美国军方需要确保弹药和武器的质量,而不能检查每一颗子弹。
他们大量采用 Shewhart 的控制图来保持生产的安全和可靠。
战后,专业人士于 1945 年成立了美国质量控制协会以保持这种势头。但奇怪的是,美国工业在很大程度上逐渐背离了这些方法。
这就是 W. Edwards Deming 介入的地方。
他将这些概念带到了日本,并在那里受到了热烈欢迎。到了 20 世纪 70 年代,日本产品以前所未有的高质量主导了全球市场。
这种竞争压力迫使美国制造商重新发现 SPC,将其带回作为现代质量保证的标准。
什么是普通原因变异?
分析过程数据的棘手之处在于:完美的一致性是一个神话。
您可能期望您的生产线每次都达到完全相同的数值,但实际上,每个过程都有自然的波动背景。
我们将此称为普通原因变异。
把它想象成汽车引擎怠速时的轻微振动。它是系统固有的,会产生可预测的噪声模式。
我们常常把这些称为不可指派或正常变异源,因为您无法指出导致它们的单一外部错误。
它们只是当前过程运作方式的一部分。
当您的数据显示只有普通原因时,我们会说过程处于统计控制中。
随着时间的推移,它会产生稳定、可重复的分布。它创造了一个可靠的心跳,即使它不是完全平坦的,您也可以预测它。
普通原因的示例
想象一下这些正常振动是什么样子的会有所帮助。这些代表了您设施的标准操作条件:
- 材料特性: 供应商规格范围内抗拉强度的细微变化。
- 环境: 车间湿度或温度从早到晚的可预测变化。
- 工具磨损: 钻头或切削工具在其使用寿命内缓慢、正常的退化。
- 操作员差异: 操作员手动拨入设置时的微小差异。
- 测量系统: 卡尺或三坐标测量机 (CMM) 探头固有的不确定性或”噪声”。
这只是众多其他潜在示例中的一部分。
什么是特殊原因变异?
如果说普通原因变异是机器柔和的背景”嗡嗡声”,那么特殊原因变异就是响亮的”咔哒声”。
它代表了来自外部来源的变异,这些来源不是标准过程循环的一部分。在统计学界,我们常常称之为可指派来源,因为与一般噪声不同,通常您可以确切地指出出了什么问题。
问题是,
虽然普通原因影响您生产的每一件物品,但特殊原因却是鬼鬼祟祟的。它们通常只影响过程输出的一部分,并且往往是间歇性和不可预测的。
您可能会看到一系列完美的零件,然后突然间,一切都乱套了。
当您在控制图上发现这种模式时(通常是当数据点跳出控制上限或控制下限时),这表明过程失去了统计控制。
好消息是?
特殊原因实际上比普通原因更容易修复。一旦您识别并消除了那个特定的捣乱鬼,您的过程就会恢复到”稳定”状态。
您只需要快速识别它,因为当它发生时,通常会产生很多麻烦。
示例
这些咔哒声是破坏流程的明显、可指派的事件。一些经典示例:
- 特定的机器控制器意外故障。
- 操作员不断进行不当的设备调整。
- 测量系统的突然变化(例如使用了掉落过的量规)。
- 一批性能超出设计规格的劣质原材料。
- 物理破损,例如钻头折断或冲头崩裂。
- 一名未经适当培训的新手操作员接手轮班。
如您所见,它的起因非常(非常)广泛。
什么是控制图?
如果您想可视化您的制造过程,您需要控制图。
纵观 SPC 的历史,该工具仍然是该方法论的绝对基石。它允许我们监控过程随时间的变化,并帮助我们区分随机背景噪声(普通原因变异)和实际的可修复问题(特殊原因变异)。
把控制图想象成现代汽车中的车道保持辅助系统。它知道您是在车道内轻微漂移,还是真的偏离了道路。
每个控制图都建立在三个主要组成部分之上:
- 中心线 (CL): 这代表过程数据的平均值或受控均值。
- 控制上限 (UCL): 过程预期的最大值。
- 控制下限 (LCL): 过程预期的最小值。
我们通常使用三西格玛法则来定义这些限制。
我们取平均值 并加上或减去三个标准差。
数学公式如下:
因为正态分布中 99.73% 的数据点都在这个范围内,所以任何落在这些控制限之外的观察结果都是一个巨大的红色警报。它预示着潜在的失控状况,需要立即调查。
关于控制限和规格限之间区别的说明。控制限是根据您的实际过程数据计算得出的。规格限是客户(或工程师)在蓝图上定义的可接受范围。它们不是一回事!
如果您想查看更多关于如何绘制这些图表的示例,可以查看官方 ASQ 控制图资源。
质量控制 7 大工具
当您深陷海量生产数据集的泥潭时,很容易错过信号。
我们需要一种方法来梳理这种混乱。
1974 年,石川馨博士在他的经典著作质量控制指南中正式提出了一种解决方案。他策划了一套特定的视觉技术,旨在帮助任何人(不仅仅是统计学家)解决质量问题。
这是标准工具包:
- 因果图(鱼骨图): 一种映射潜在输入(人、机、料)以找出缺陷根本原因的方法。
- 检查表: 用于实时一致地收集数据的简单结构化表格。
- 控制图: 可能是最重要的。它跟踪过程随时间的变化,以捕捉特殊原因变异。
- 直方图: 显示数据值分布(形状)的条形图。
- 帕累托图: 通过将关键的少数问题与琐碎的多数(80/20 法则)分开,帮助您确定修复的优先级。
- 散点图: 可视化两个变量之间的关系,看看它们是否相关。
- 分层法: 将来自不同来源(如不同轮班或机器)的数据分开,以揭示隐藏的模式。
这些工具是任何稳健 SPC 分析的基础。在尝试应用复杂算法之前,您可以使用这七个辅助工具来可视化变异并稳定过程。
7 个补充工具
经典的 QC 7 大工具非常棒,但它们是通用的。
有时您会遇到特定的障碍,数据混乱或者根本原因隐藏在过程逻辑本身中。这就是 7 个补充工具 (7-SUPP) 发挥作用的地方。
这有点像一种专门的”侦探工具包”,当基本工具向您展示那里有问题,但您需要更敏锐的镜头来理解上下文时,您就会拿出它。
- 数据分层:将数据切分成有意义的桶(如白班与夜班)以暴露隐藏的模式。
- 缺陷图:直接在零件图纸上可视化缺陷的物理位置。
- 事件日志:记录过程异常的纯粹基于时间的上下文。
- 流程图:映射工作流步骤的逻辑和顺序。
- 进度中心:监控项目中的特定决策点或里程碑。
- 随机化:确保您的抽样不会意外地因时间或操作员模式而产生偏差的技术。
- 样本量确定:精确计算统计显著性所需的数据量。
每当您需要深入挖掘过程故障的方式和位置时,您都应该使用这些工具来补充基本的 7 个 QC 工具。
如何实施 SPC
实施 SPC 并非易事。
一个常见的错误是试图一次测量所有东西。但秘密在于:好的 SPC 在于聚焦。
您不应该测量每一个变量。相反,您应该从识别关键特性 (KC) 或关键特征开始。
我们通常在设计失效模式及后果分析 (DFMEA) 或设计审查期间找到这些。
一旦您知道要测量什么,实施通常遵循三阶段思维模型:
- 第一阶段:理解。 您绘制过程图并定义规格限。在您可以跟踪好坏之前,您需要知道什么是好的。
- 第二阶段:稳定。 这是一个看似简单实则复杂的部分。您必须识别并消除可指派的变异源(特殊原因)。如果您的机器有一个松动的螺栓导致剧烈摆动,任何图表都无法修复它。您必须先稳定过程,只留下普通原因变异。
- 第三阶段:监控。 既然过程已经稳定,您可以使用控制图来观察正在进行的生产。这就是您计算控制上限和控制下限的地方,以便检测情况何时开始发生偏差。
将 SPC 思考为两个不同的阶段很有帮助:过程建立(第一和第二阶段),即您正在修复系统,以及常规生产(第三阶段),即您只是保持其正常运行。
什么是过程能力指数?
所以你有了一个控制图,它看起来很稳定。这意味着你的过程是一致的。但一个过程可能非常稳定,却仍然生产出错误的零件。这只是意味着你在持续地制造坏零件。
这就是过程能力指数发挥作用的地方。
它预测您的稳定过程是否生产出实际符合设计要求的合格产品。
我喜欢用”车库里的汽车”思维模型来理解 Cp 和 Cpk 之间的区别:
- Cp(过程能力): 这就像问,”汽车够小能进车库吗?”它将过程的自然分布与规格限的宽度进行比较。
- Cpk(过程能力指数): 这就像问,”你是把车停在中间,还是刮到了后视镜?”它考虑了中心位置。如果您的 Cpk 很低,您的过程可能足够紧凑,但它偏离了目标。
这里有一个大”陷阱”:您只能对稳定过程进行过程能力分析。如果您的控制图显示过程失控,能力计算就会变成毫无意义的噪音。
当您根据这些指数绘制数据点时,您就创建了一个过程特征。这可以精确地可视化您的数据行为如何符合能力指数。
永远记住限制的黄金法则:控制限来自数据(过程的声音),而规格限来自工程师或客户(客户的声音)。
要拥有一个有能力的过程,您的控制限应始终舒适地落在这些规格限之内。
分析 SPC 数据
一旦您绘制了控制图,真正的工作就开始了。事实证明,解释这些数据与其说是复杂的数学,不如说是模式识别。
把图表想象成生产线的心跳监视器。
如果只存在普通原因变异,您的数据点将在控制上限和下限之间随机跳动。这是健康状态,您应该让过程保持原样。
然而,
当特殊原因潜入时,数据会留下痕迹,通常在您制造出一个坏零件之前。
我们使用特定的检测规则来识别这些失控状况。请留意这些模式:
- 运行: 7 个或更多数据点停留在中心线的一侧。
- 趋势: 7 个或更多点持续上升或下降。
- 离散度变化: 点突然紧密聚集或广泛分散。
- 偏移: 数据分布移动到正常均值之上或之下。
如果您发现这些模式,您就必须扮演侦探。
像石川图、帕累托图或实验设计这样的工具可以帮助您找出根本原因。
此外,验证您的测量方法是否可靠。如果您依赖无损检测或 NDT 获取数据,请确保设备本身没有引入变异。
SPC 益处
大多数质量团队的运作方式就像守门员。他们站在生产线的末端,极力阻止坏零件流向客户。
这是基于检测的质量控制。
问题是,即使您发现了缺陷,用于制造它的时间和金钱也已经一去不复返了。
这并不意味着您不应该这样做,而是意味着您不应该只依赖这一点。
SPC 将您的角色从守门员转变为教练。您不再只是评判最终输出,而是在不断地调整过程本身。
从检测到预防的转变才是真正的超能力。通过在变成缺陷之前捕捉到向控制上限的漂移,您可以从根本上阻止问题的发生。
以下是这种方法为您的工厂解锁的好处:
- 减少浪费: 您及早发现问题,显著减少废品堆。
- 节省时间: 您最大限度地减少了耗时的返工循环。
- 优化: 您可以安全地以最大潜力运行您的过程,因为您了解它的行为。
- 节省成本: 事实证明,全面实施 SPC 是保护您底线的最有效方法之一。
当您不再忙于救火时,您终于有时间(和预算)来建立更好的过程。
超越制造
您可能认为统计过程控制严格适用于工厂车间和装配线。但这才是令人着迷的地方:数学并不关心您是在测量钢螺栓的直径还是贷款申请的处理时间。
事实证明,SPC 是任何重复过程的超能力。
这就是为什么它在 ISO 9000 质量管理体系中运作良好的原因。我们经常看到它被用于财务审计、IT 运营和医疗保健流程。甚至像客户计费和贷款管理这样的行政任务也可以在控制图上进行跟踪。
软件行业其实在几十年前就意识到了这一点。1988 年,能力成熟度模型 (CMM) 建议将 SPC 应用于软件工程。今天,在 CMMI 4 级和 5 级运营的组织使用这些统计工具来预测项目绩效。
这里有一个陷阱。SPC 依赖重复来建立基线。由于”过程”每天看起来都不一样,对于像研发或创意设计这样的非重复性、知识密集型工作,它通常是无效的。
工业 4.0 和人工智能
我们传统上认为 SPC 是一种测量物理事物的工具,比如螺丝的直径或麦片盒的重量。
但随着工业 4.0 的到来,游戏规则已经完全改变。
我们不再仅仅关注物理小部件,我们正在处理网络物理系统和海量的高维数据流。
事实证明,您可以应用同样的统计超能力来监控人工智能模型的健康状况。就像物理钻头会磨损一样,AI 模型也会遭遇概念漂移,随着时间的推移,其预测准确性会慢慢降低。
这就是真正酷的地方。
工程师们现在正在使用非参数多变量控制图来跟踪神经网络嵌入的变化。神奇的是,这一过程甚至不需要标记数据。
它实现了复杂 AI 系统的实时稳定性监控。
结论
统计过程控制实际上只是一种倾听生产线心跳的方式。事实证明,数学其实是我们最好的倾听者。通过使用控制图,您不再猜测零件为何失效,而是开始了解过程的个性。
最棒的是,当您终于区分出背景噪声(普通原因变异)和实际问题(特殊原因变异)时。
意识到这种区别非常重要。
它能让您免于微调实际上正常的机器,并在事情真正偏离轨道时迫使您采取行动。
想到这一切始于二战中的弹药,现在却驱动着 AI 智能工厂,真是太疯狂了,但核心逻辑并没有改变。
无论您是使用铅笔还是神经网络,目标都是持续改进。您将获得更少的浪费、显著的成本节约和一个更加平静的生产现场。
如果您准备实施此操作,我强烈推荐您阅读 AIAG SPC 参考手册。它成为行业标准是有原因的。不要害怕请质量专家来帮助建立最初的几个图表。
起初,实施它可能感觉看似复杂,但不要被数学吓跑。从一个关键特性开始,尽量减少变异,看看会发生什么。
去测量一些很酷的东西,并保持过程稳定!
常见问题解答
统计过程控制的主要目的是什么?
您使用 SPC 来局部监控和控制过程。通过随时间跟踪数据,您可以及早发现问题并在缺陷发生之前进行预防。这将质量控制从检测转变为预防,为您节省检查成本并减少报废。
普通原因变异与特殊原因变异有何不同?
普通原因变异是过程固有的自然噪声,如轻微振动。它始终存在。特殊原因变异来自特定的外部因素,如工具损坏或材料批次不良。您必须识别并消除特殊原因以稳定过程。
为什么 SPC 比检查成品更好?
检查成品只能在您犯错后发现错误。SPC 实时监控过程,以便在产生坏零件之前捕捉到变化。这减少了浪费和返工,因为当出现问题时,您会立即停止生产线。
开始使用 SPC 严格需要什么工具?
控制图是 SPC 的主要工具。您使用它根据时间限制绘制数据。虽然您可能会使用直方图或帕累托图进行分析,但控制图专门告诉您过程是否保持稳定或需要立即调整。
您可以将 SPC 方法应用于制造环境之外吗?
是的,您可以在任何具有可测量输出的过程中使用 SPC。服务行业使用它来跟踪计费中的错误率,软件团队使用它来监控系统性能。如果过程随时间生成数据,您可以应用这些统计控制。
过程处于统计控制中意味着什么?
当只存在普通原因变异时,过程处于控制之中。输出保持可预测并落在统计限值内。这并不一定意味着部件符合工程公差,但意味着过程是一致、稳定和可重复的。
控制限与规格限有何不同?
规格限来自客户或工程设计。控制限来自实际过程数据。您根据过去表现计算控制限以定义过程稳定性,而您必须满足规格限才能将产品出售给客户。
Cp 和 Cpk 能力指数有什么区别?
Cp 衡量的是如果过程完全居中,您的过程的潜在能力。它只看数据的离散度。Cpk 通过考虑数据相对于限制的居中程度来衡量实际能力。您需要 Cpk 来了解实际性能。
何时应使用 X-bar 和 R 图?
当在小分组(通常在两到八个样本之间)中收集计量数据时,您使用 X-bar 和 R 图。X-bar 跟踪平均值以查看集中趋势的变化,而 R 图监控该特定分组内的范围或变异。
为什么子组大小在控制图设计中很重要?
子组大小影响您检测过程偏移的速度。较小的子组在现场更容易管理。较大的子组提供了更大的统计能力来检测过程均值的微小变化,但它们增加了检查和数据输入所需的时间。