算法简介

粒子群算法（PSO）来源于对一个简化社会模型的模拟，该算法最初是为了图形化地模拟鸟群优美而不可预测的运动。在鸟群觅食过程中，我们假定鸟群中信息共享，每个个体都知道自己与其它个体的当前觅食地点和历史最佳觅食地点，因此个体下一运动状态趋势如下：

受飞行惯性影响，个体将沿原飞行方向运动
个体向自己的历史最佳觅食地点运动
个体向当前鸟群中最佳觅食地点运动

将这三个运动矢量合成，即可得知下一觅食地点。

这是一个迭代过程，我们认为鸟群中个体的运动是同时发生的，并将一次运动过程视为一代，当群体的规模较大且迭代次数较多时，鸟群中所有个体将向该有限空间内的最佳觅食地点靠拢。

在处理优化问题时，粒子群算法将自变量集合视为个体觅食地点的坐标，将优化目标函数视为觅食地点的评价方法，将自变量在其领域的偏移视为鸟群个体的运动过程，当鸟群聚集于最佳觅食点时，此时自变量的取值刚好满足优化目标的全局最优。

进化方程

粒子群算法将每个个体看作$D$维空间中的一个没有体积的微粒，在搜索空间中以一定速度飞行，这个速度根据它本身的飞行经验和同伴的飞行经验来动态调整。第$i$个微粒表示为$X_i=(x_{i1},x_{i2},…,x_{iD})$，它经历过的最好位置（有最好适应值）记为$P_i=(p_{i1},p_{i2},…,p_{iD})$.在群体所有微粒经过的最好位置的索引号用符号$g$表示，即$P_g$. 微粒$i$的速度为$V_i=(v_{i1},v_{i2},…,v_{iD})$，对于每一维度的第$t$代，它的第$t+1$代根据如下方程进行变化：

$V_{i}^{t+1}=w\cdot V_i^t + c_1\cdot r_1 \cdot (P_i^t-X_i^t)+c_2 \cdot r_2 \cdot (P_{g}^t-X_i^t)\\ ~\\ X_i^{t+1}=X_i^t+V_i^{t+1}$

参数含义如下：

$V_i^k$：第$i$个粒子第$k$代的速度，即第$k-1$代到第$k$代的运动矢量
$X_i^k$：第$i$个粒子第$k$代的位置坐标
$w$：自身权重系数，取$0.9$到$1.2$较合适
$c_1$：自身认知常数，取$2.0$较合适
$c_2$：社会认知常数，取$2.0$较合适
$r_1,r_2$：区间$[0,1]$内随机数
$P_i^k$：第$i$个粒子运动到第$k$代时的历史最好位置
$P_{gi}^k$：所有微粒运动到第$k$代时的历史最好位置

除了以上在公式中出现的参数，还有其它参数需要注意，如种群规模即粒子数量，粒子位置的范围即自变量定义域，运动速度上下限等。

算法步骤

$step\ 1$ 初始化微粒（群体规模为$m$），微粒的初始位置和速度取随机值

$step\ 2$ 评价每个微粒的适应度（优化目标函数值）

$step\ 3$ 对每个微粒，将它的适应值和它经历过的最好位置pbest的作比较，如果较好，则将其作为该粒子历史最佳位置pbest

$step\ 4$ 对每个微粒，将它的适应值和全局所经历最好位置 gbest的作比较，如果较好，则将其作为全局最佳位置gbest

$step\ 5$ 依据进化方程更新微粒的速度与位置

$step\ 6$ 如未达到结束条件（通常为足够好的适应值或达到一个预设最大代数 $G_{max}$ ），回到$step\ 2$

算法案例

无约束条件

以Bukin函数为例，其函数形式如下：

$f(x)=100\sqrt {|x_2-0.01x_1^2|}+0.01|x_1+10|\\ ~\\ x_1\in [-15, -5],\ x_2\in [-3,3]$

已知该函数在$x^{*}=(-10,1)$时有最小值$0$。下面用粒子群算法求解最优值

该例中，粒子运动空间的维度为$2$，取种群规模为$100$，更新代数为$500$，速度范围为$[-1,1]，$自身权重因子$0.9$，自身认知常数$2.0$，社会认知常数$2.0$。程序如下：

import numpy as np  
import random 
import math
class PSO:
    def __init__(self, size, nVar, xMin, xMax, vMin, vMax, times):
        self.size = size								# 种群规模
        self.nVar = nVar								# 空间维数
        self.times = times								# 迭代次数
        self.x = np.zeros((size, nVar), dtype=float)	# 粒子坐标
        self.v = np.zeros((size, nVar), dtype=float)	# 粒子速度
        self.xMin = np.array(xMin, dtype = float)		# 粒子位置下限
        self.xMax = np.array(xMax, dtype = float)		# 粒子位置上限
        self.vMin = vMin								# 粒子速度下限
        self.vMax = vMax								# 粒子速度上限
        # 粒子坐标与速度随机值
        for i in range(size):
            for j in range(nVar):
                self.x[i][j] = random.uniform(self.xMin[j], self.xMax[j])
                self.v[i][j] = random.uniform(self.vMin, self.vMax)
        # 单个粒子最有值与全局最优值索引
        self.pBest = self.x.copy()
        self.gBest = 0
    def fitness(self, x):
        x1 = x[0]
        x2 = x[1]
        f = 100 * np.sqrt(np.abs(x2 - 0.01*x1**2)) + 0.01 * np.abs(x1 + 10)
        return f
    def update(self, w, c1, c2):
        for t in range(self.times):
            for i in range (self.size):
                # 更新粒子速度
                self.v[i] = w * self.v[i] + random.uniform(0, 1) * c1 * (self.pBest[i] - self.x[i]) + random.uniform(0, 1) * c2 * (self.pBest[self.gBest] - self.x[i])
                # 确保速度不超过上下限
                self.v[i][self.v[i] < self.vMin] = self.vMin
                self.v[i][self.v[i] > self.vMax] = self.vMax
                # 更新粒子位置
                self.x[i] += self.v[i]
                # 确保位置不超过上下限
                for j in range(self.nVar):
                    if self.x[i][j] > self.xMax[j]:
                        self.x[i][j] = self.xMax[j]
                    if self.x[i][j] < self.xMin[j]:
                        self.x[i][j] = self.xMin[j]
                # 比较每个粒子的新的适应度与历史最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[i]):
                    self.pBest[i] = self.x[i]
                # 比较当前粒子的新适应度与全局最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[self.gBest]):
                    self.gBest = i
    def display(self):
        print(self.pBest[self.gBest])
        print(self.fitness(self.pBest[self.gBest]))

if __name__ == '__main__':
    # 种群规模为100，更新500代
    bukin = PSO(size=100, nVar=2, xMin=[-15, -3], xMax=[-5, 3], vMin=-1, vMax=1, times=500)
    # 自身权重因子0.9，自身认知常数2.0，社会认知常数2.0
    bukin.update(w = 0.9, c1 = 2.0, c2 = 2.0)
    bukin.display()

筛选最优输出结果为

1 2	[-10.77631364 1.16128901] 0.0662286658094341

有约束条件

与模拟退火算法相同，在处理约束条件时我们依旧采用罚函数的思想，将约束条件转换为限制粒子飞行的因素。

$min\ f(x)=0.4x_2 + x_1^2+x_2^2-x_1x_2+ \frac{1}{30}x_1^3\\ ~\\ s.t.\ \begin{cases} x_1+0.5x_2 \geq 0.4\\ 0.5x_1+x_2 \geq 0.5\\ x_1\geq 0, x_2 \geq 0 \end{cases}$

对于该例子，利用惩罚函数法，将约束条件转化为惩罚项，定义$P_1=(\min(x_1+0.5x_2-0.4,0))^2$，$P_2=(\min(0.5x_1+x_2-0.5,0))^2$，此时构造新的增广目标函数$min\ F(X,M_t)=f(X)+M_t(P_1+P_2)$，其中$M_t$为惩罚因子。

粒子运动空间的维度为$2$，取种群规模为$100$，更新代数为$500$，速度范围为$[-1,1]，$自身权重因子$0.9$，自身认知常数$2.0$，社会认知常数$2.0$。该例自变量没有上限，但我们可以粗略估计在最优解时自变量$x_1$，$x_2$都落在$[0,1.0]$内，因此将粒子坐标的上限设为$1.0$。

import numpy as np  
import matplotlib.pyplot as plt 
import random

class PSO:
    # 初始化参数
    def __init__(self, size, dim, xMin, xMax, vMin, vMax, times):
        self.size = size							# 种群规模
        self.dim = dim								# 空间维度
        self.vMin = vMin							# 粒子速度下限
        self.vMax = vMax							# 粒子速度上限
        self.times = times							# 迭代次数
        self.xMin = np.array(xMin, dtype = float)	# 粒子坐标下限
        self.xMax = np.array(xMax, dtype = float)	# 粒子坐标上限
        # 粒子的位置与速度初始值均为随机值
        self.x = np.zeros((size, dim), dtype = float)
        self.v = np.zeros((size, dim), dtype = float)
        for i in range(size):
            for j in range(dim):
                self.x[i][j] = random.uniform(self.xMin[j], self.xMax[j])
                self.v[i][j] = random.uniform(self.vMin, self.vMax)
        # 单个粒子的最佳坐标和全局最佳坐标
        self.pBest = self.x.copy()
        self.gBest = 0
        # 每一代的全局最优值
        self.bestList = list()
    # 带有惩罚项的适应度
    def fitness(self, x, M):
        x1 = x[0]
        x2 = x[1]
        # 目标函数
        fx = 0.4*x2 + x1**2 + x2**2 - x1*x2 + (1/30)*(x1**3)
        # 惩罚项
        p1 = (min(x1 + 0.5*x2 - 0.4, 0))**2
        p2 = (min(0.5*x1 + x2 - 0.5, 0))**2
        # 增广函数
        Fx = fx + M*(p1 + p2)
        return fx, Fx
    # 种群更新迭代
    def update(self, w, c1, c2):
        for t in range(self.times):
            for i in range(self.size):
                # 更新粒子速度
                self.v[i] = w*self.v[i] + c1 * random.uniform(0, 1) * (self.pBest[i] - self.x[i]) + c2 * random.uniform(0, 1) * (self.pBest[self.gBest] - self.x[i])
                self.v[i][self.v[i] < self.vMin] = self.vMin
                self.v[i][self.v[i] > self.vMax] = self.vMax
                # 更新粒子坐标
                self.x[i] = self.x[i] + self.v[i]
                for j in range(self.dim):
                    if self.x[i][j] > self.xMax[j]:
                        self.x[i][j] = self.xMax[j]
                    if self.x[i][j] < self.xMin[j]:
                        self.x[i][j] = self.xMin[j]
                # 惩罚因子
                M = t**(3/2)
                # 目标函数值与适应度
                fx, Fx = self.fitness(self.x[i], M)
                pBest_fx, pBest_Fx =  self.fitness(self.pBest[i], M)
                gBest_fx, gBest_Fx = self.fitness(self.pBest[self.gBest], M)
                # 更新单个粒子最优坐标与全局最优坐标
                if Fx < pBest_Fx:
                    self.pBest[i] = self.x[i]
                # 比较当前粒子的新适应度与全局最佳适应度
                if Fx < gBest_Fx:
                    self.gBest = i
            self.bestList.append(self.fitness(self.pBest[self.gBest], M)[0])
    def display(self):
        print(self.pBest[self.gBest])
        print(self.fitness(self.pBest[self.gBest], 0)[1])
        # 绘图
        plt.plot(self.bestList)
        plt.show()

if __name__ == '__main__':
    pso = PSO(size=100, dim=2, xMin=[0, 0], xMax=[1.0, 1.0], vMin=-1, vMax=1, times=500)
    pso.update(w = 0.9, c1 = 2.0, c2 = 2.0)
    pso.display()

输出结果为

1 2	[0.34072776 0.32958779] 0.2455774890528109

从图像中可以看出，在20代左右全局最优值已经趋于稳定，并接近最终解。**需要注意，从图像上看，最初几代的全局最优值要比最终结果更小，这是因为该图像纵坐标表示优化目标函数值$f(x)$，不包含惩罚项。这时函数值虽然更小，但变量并不满足约束条件。** 这与解空间上限的取值有关，读者不妨取其它值试验，观察图像的差异。 # 改进算法 ## 二阶粒子群算法粒子群算法是一种简单高效的优化算法，但其很容易陷入局部最优。在第$t$代，粒子$i$的实际运动速率为$v_i^t$为$x_i^t-x_i^{t-1}$，若仅考虑粒子向个体最佳位置*pbest*运动，粒子的速度变化率为 $$ v_i^{t+1}-v_i^t=(P_i-x_i^t)-(x_i^t-x_i^{t-1})=P_i-2x_i^t+x_i^{t-1} $$ 仅考虑粒子向全局最佳位置*gbest*运动，粒子的速度变化率为 $$ v_i^{t+1}-v_i^t=(P_g-x_i^t)-(x_i^t-x_i^{t-1})=P_g-2x_i^t+x_i^{t-1} $$ 当同时考虑个体最佳位置与全局最佳位置的影响时，微粒的速度变化率应为上述两种情况的随机加权，并在算法中引入**惯性权重$w$** 来平衡算法的全局搜索能力与局部搜索能力。设$\varphi_1$为$c_1r_1$，$\varphi_2$为$c_1r_1$ ,得到二阶PSO算法的进化方程如下 $$ v_i^{t+1}=wv_i^t+\varphi_1(P_i-2x_i^t+x_i^{t-1})+\varphi_2(P_g-2x_i^t+x_i^{t-1})\\ ~\\ x_i^{t+1}=x_i^t+v_i^{t+1} $$

def update2d(self, w, c1, c2):
        for iterator in range(self.times):
            # 上一代粒子的位置，初始为所有粒子的初始位置
            xPrev = self.x.copy()
            for i in range (self.size):
                # 更新粒子速度
                self.v[i] = w * self.v[i] + random.uniform(0, 1) * c1 * (self.pBest[i] - 2*self.x[i] + xPrev[i]) + random.uniform(0, 1) * c2 * (self.pBest[self.gBest] - 2*self.x[i] + xPrev[i])
                # 确保速度不超过上下限
                self.v[i][self.v[i] < self.vMin] = self.vMin
                self.v[i][self.v[i] > self.vMax] = self.vMax
                # 更新粒子位置
                self.x[i] += self.v[i]
                # 确保位置不超过上下限
                for j in range(self.nVar):
                    if self.x[i][j] > self.xMax[j]:
                        self.x[i][j] = self.xMax[j]
                    if self.x[i][j] < self.xMin[j]:
                        self.x[i][j] = self.xMin[j]
                # 比较每个粒子的新的适应度与历史最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[i]):
                    self.pBest[i] = self.x[i]
                # 比较当前粒子的新适应度与全局最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[self.gBest]):
                    self.gBest = i

仍以*Bukin*函数为例，筛选出的最优结果为

1 2	[-10.39337108 1.08022159] 0.0219605855713847

相较于标准的粒子群算法，二阶粒子群算法仅对进化方程进行改动，改进效果并不明显。 ## 二阶振荡粒子群算法为了进一步提高群体的多样性，可考虑在二阶粒子群算法中引入一个振荡环节，来改善算法的全局收敛性。其进化方程描述如下 $$ v_i^{t+1}=wv_i^{t}+\varphi_1(P_i-(1+\xi_1)x_i^t+\xi_2x_i^{t-1})+\varphi_2(P_g-(1+\xi_3)x_i^t+\xi_4x_i^{t-1})\\ ~\\ x_i^{t+1}=x_i^t+v_i^{t+1} $$ 当$0<\xi_2<\frac{1+\xi_1}{2}$，$0<\xi_4<\frac{1+\xi_3}{2}$，$0<\xi_1<1$，$0<\xi_3<1$时，算法振荡收敛；当$\xi_1<\xi_2-1$，$\xi_3<\xi_4-1$，$0<\xi_2<1$，$0<\xi_4<1$时，算法渐进收敛。

在全局算法中，一般地，希望算法前期有较高的搜索能力以得到合适的种子，而在后期有较高的开发能力以加快收敛速度。也就是希望算法前期全局搜索能力较强，后期剧不搜索能力较强。因此，PSO算法做如下更改：

$step\ 4$ 依据二阶振荡PSO进化方程更新微粒的速度与位置。当前代数$t<G_{max}/2$时，取$0<\xi_2<\frac{1+\xi_1}{2}$，$0<\xi_4<\frac{1+\xi_3}{2}$，$0<\xi_1<1$，$0<\xi_3<1$；当前代数$t\geq G_{max}/2$时，取$\xi_1<\xi_2-1$，$\xi_3<\xi_4-1$，$0<\xi_2<1$，$0<\xi_4<1$.

二阶振荡粒子群算法程序如下

def update2dvib(self, w, c1, c2):
        for t in range(self.times):
            # 上一代粒子的位置，初始为所有粒子的初始位置
            xPrev = self.x.copy()
            for i in range (self.size):
                # 设置参数
                phi1 = random.uniform(0, 1) * c1
                phi2 = random.uniform(0, 1) * c2
                # 振荡因子在前半段和后半段取值不同
                if t < self.times/2:
                    xi1 = random.uniform(0, 1)
                    xi3 = random.uniform(0, 1)
                    xi2 = random.uniform(0, (1 + xi1)/2)
                    xi4 = random.uniform(0, (1 + xi3)/2)
                else:
                    xi2 = random.uniform(0, 1)
                    xi4 = random.uniform(0, 1)
                    xi1 = random.uniform(0, xi2 - 1)
                    xi3 = random.uniform(0, xi4 - 1)
                # 二阶振荡粒子群算法进化方程
                self.v[i] = w * self.v[i] + phi1 * (self.pBest[i] - (1+xi1)*self.x[i] + xi2 * xPrev[i]) + phi2 * (self.pBest[self.gBest] - (1+xi3)*self.x[i] + xi4 * xPrev[i])
                # 确保速度不超过上下限
                self.v[i][self.v[i] < self.vMin] = self.vMin
                self.v[i][self.v[i] > self.vMax] = self.vMax
                # 更新粒子位置
                self.x[i] += self.v[i]
                # 确保位置不超过上下限
                for j in range(self.nVar):
                    if self.x[i][j] > self.xMax[j]:
                        self.x[i][j] = self.xMax[j]
                    if self.x[i][j] < self.xMin[j]:
                        self.x[i][j] = self.xMin[j]
                # 比较每个粒子的新的适应度与历史最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[i]):
                    self.pBest[i] = self.x[i]
                # 比较当前粒子的新适应度与全局最佳适应度
                if self.fitness(self.x[i]) < self.fitness(self.pBest[self.gBest]):
                    self.gBest = i

依旧以Bukin函数为例，筛选出的最优结果为

1 2	[-10. 1.] 0.0

可以看到结果非常接近标准最优解，这说明二阶振荡PSO算法相较于二阶PSO算法与标准PSO算法精度得到很大提升。