A Novel Temporal Feature Selection for Time-Adaptive Transient Stabiity Assessment

首页摘要：

ISGT Europe 2019 于2019年9月底在罗马尼亚首都举办，简单总结了一篇论文投稿。主要内容是针对自适应电力系统暂态稳定评估提出了一种时间序列特征选择方法，仿真结果表明能够在保持评估精度的前提下有效减少训练时间以及降低平均评估时间。

以下为主要实现代码

（1）特征重要性计算程序（MATLAB)

function [ranked,weight] = relieff_tan(X,Y,K,varargin)
% 计算多维时间序列的特征重要性
% X为输入特征，格式为N*n*T，其中N为样本数目，n为特征维数，T为时间商都
% Y为类别标签
if nargin<3
    error(message('stats:relieff:TooFewInputs'));
end

% 检查X数据格式是否正确
if ~isnumeric(X)
    error(message('stats:relieff:BadX'));
end

% Parse input arguments
validArgs = {'method' 'prior' 'updates'   'categoricalx' 'sigma'};
defaults  = {      ''      []     'all'            'off'      []};

% Get optional args
[method,prior,numUpdates,categoricalX,sigma] ...
    = internal.stats.parseArgs(validArgs,defaults,varargin{:});
[X,Y] = removeNaNs(X,Y);
    
% Group Y for classification. Get class counts and probabilities.
% Get groups and matrix of class counts
if isa(Y,'categorical')
    Y = removecats(Y);
end
[Y,grp] = grp2idx(Y);
[X,Y] = removeNaNs(X,Y);
Ngrp = numel(grp); % 两类就是2个，有几类就有几个
N = size(X,1);
C = false(N,Ngrp);
C(sub2ind([N Ngrp],(1:N)',Y)) = true;

% Get class probs
if isempty(prior) || strcmpi(prior,'empirical')
    classProb = sum(C,1);
elseif strcmpi(prior,'uniform')
    classProb = ones(1,Ngrp);
elseif isstruct(prior)
    if ~isfield(prior,'group') || ~isfield(prior,'prob')
        error(message('stats:relieff:PriorWithMissingField'));
    end
    if iscell(prior.group)
        usrgrp = prior.group;
    else
        usrgrp = cellstr(prior.group);
    end
    [tf,pos] = ismember(grp,usrgrp);
    if any(~tf)
        error(message('stats:relieff:PriorWithClassNotFound', grp{ find( ~tf, 1 ) }));
    end
    classProb = prior.prob(pos);
elseif isnumeric(prior)
    if ~isfloat(prior) || length(prior)~=Ngrp || any(prior<0) || all(prior==0)
        error(message('stats:relieff:BadNumericPrior', Ngrp));
    end
    classProb = prior;
else
    error(message('stats:relieff:BadPrior'));
end
    
    % Normalize class probs
    classProb = classProb/sum(classProb);
    
    % If there are classes with zero probs, remove them
    zeroprob = classProb==0;
    if any(zeroprob)
        t = zeroprob(Y);
        if sum(t)==length(Y)
            error(message('stats:relieff:ZeroWeightPrior'));
        end
        Y(t) = [];
        X(t,:) = [];
        C(t,:) = [];
        C(:,zeroprob) = [];
        classProb(zeroprob) = [];
    end


% Do we have enough observations?
if length(Y)<2
    error(message('stats:relieff:NotEnoughObs'));
end

% Check the number of nearest neighbors
if ~isnumeric(K) || ~isscalar(K) || K<=0
    error(message('stats:relieff:BadK'));
end
K = ceil(K);

% 检查迭代数目
if (~ischar(numUpdates) || ~strcmpi(numUpdates,'all')) && ...
        (~isnumeric(numUpdates) || ~isscalar(numUpdates) || numUpdates<=0)
    error(message('stats:relieff:BadNumUpdates'));
end
if ischar(numUpdates)
    numUpdates = size(X,1);
else
    numUpdates = ceil(numUpdates);
end

% Check the type of X
if ~ischar(categoricalX) || ...
        (~strcmpi(categoricalX,'on') && ~strcmpi(categoricalX,'off'))
    error(message('stats:relieff:BadCategoricalX'));
end
categoricalX = strcmpi(categoricalX,'on');

% Check sigma
if ~isempty(sigma) && ...
        (~isnumeric(sigma) || ~isscalar(sigma) || sigma<=0)
    error(message('stats:relieff:BadSigma'));
end
if isempty(sigma)
        sigma = Inf;
end

% The # updates cannot be more than the # observations
numUpdates = min(numUpdates, size(X,1));

% Choose the distance function depending upon the categoricalX
if ~categoricalX
    distFcn = 'cityblock';
end

% Find max and min for every predictor
p = size(X,2); % 样本数目
Xmax = max(X,[],[1 3]); % 时间序列每个特征值的最大值
Xmin = min(X,[],[1 3]);% 时间序列每个特征值的最小值
Xdiff = Xmax-Xmin;

% Exclude single-valued attributes
isOneValue = Xdiff < eps(Xmax); % eps是一个函数，可以返回某一个数N的最小浮点数精度
if all(isOneValue)
    ranked = 1:p;
    weight = NaN(1,p);
    return;
end
X(:,isOneValue) = [];
Xdiff(isOneValue) = [];
rejected = find(isOneValue);
accepted = find(~isOneValue);

% 标准化
if ~categoricalX
    X = bsxfun(@rdivide,bsxfun(@minus,X,mean(X,[1,3])),Xdiff); % (X-X_mean)/(Xmax-Xmin)标准化
end

% Get appropriate distance function in one dimension.
% thisx must be a row-vector for one observation.
% x can have more than one row.
if ~categoricalX
    dist1D = @(thisx,x) cityblock(thisx,x);
end

% Call ReliefF. By default all weights are set to NaN.
weight = NaN(1,p);
weight(accepted) = RelieffClass(X,C,classProb,numUpdates,K,distFcn,dist1D,sigma);

% Assign ranks to attributes
[~,sorted] = sort(weight(accepted),'descend');
ranked = accepted(sorted);
ranked(end+1:p) = rejected;



% -------------------------------------------------------------------------
function attrWeights = RelieffClass(scaledX,C,classProb,numUpdates,K,...
    distFcn,dist1D,sigma)
% ReliefF for classification

[numObs,numAttr,Time] = size(scaledX);
attrWeights = zeros(1,numAttr);
Nlev = size(C,2);

% Choose the random instances
rndIdx = randsample(numObs,numUpdates);
idxVec = (1:numObs)';

% Make searcher objects, one object per class. 
searchers = cell(Nlev,1);
for c=1:Nlev
    searchers{c} = createns(scaledX(C(:,c),:),'Distance',distFcn); % 这里要进行修改，构建kdtree
end

% Outer loop, for updating attribute weights iteratively
for i = 1:numUpdates
    thisObs = rndIdx(i);
    
    % Choose the correct random observation
    selectedX = scaledX(thisObs,:,:);

    % Find the class for this observation
    thisC = C(thisObs,:);
    
    % Find the k-nearest hits 
    sameClassIdx = idxVec(C(:,thisC));
    sameClassX=scaledX(sameClassIdx,:,:);
    
    % we may not always find numNeighbor Hits
    lenHits = min(length(sameClassIdx)-1,K);

    % find nearest hits
    % It is not guaranteed that the first hit is the same as thisObs. Since
    % they have the same class, it does not matter. If we add observation
    % weights in the future, we will need here something similar to what we
    % do in ReliefReg.
    
    Hits = [];
    if lenHits>0
        SameDistance=[];
        for i =1:length(sameClassIdx)
            distance=sqrt(sum(sum((selectedX-sameClassX(i,:,:)).^2)));
            SameDistance=[SameDistance,distance];
        end
        [B,IS]=sort(SameDistance);
        idxH = IS(1:K); % 这里要进行修改
        idxH(1) = [];
        Hits = sameClassIdx(idxH);
    end    
    
    % Process misses
    missClass = find(~thisC);
    Misses = [];
    
    if ~isempty(missClass) % Make sure there are misses!
        % Find the k-nearest misses Misses(C,:) for each class C ~= class(selectedX)
        % Misses will be of size (no. of classes -1)x(K)
        Misses = zeros(Nlev-1,min(numObs,K+1)); % last column has class index
        
        for mi = 1:length(missClass)
            
            % find all observations of this miss class
            missClassIdx = idxVec(C(:,missClass(mi)));
            missClassX=scaledX(missClassIdx,:,:);
            % we may not always find K misses
            lenMiss = min(length(missClassIdx),K);
            % find nearest misses
            MissDistance=[];
            for i =1:length(missClassIdx)
                distance=sqrt(sum(sum((selectedX-missClassX(i,:,:)).^2)));
                MissDistance=[MissDistance,distance];
            end
            [B,IM]=sort(MissDistance);           
            idxM =IM(1:K); % 这里要进行修改
            Misses(mi,1:lenMiss) = missClassIdx(idxM);
            
        end
        
        % Misses contains obs indices for miss classes, sorted by dist.
        Misses(:,end) = missClass;
    end
            
    %***************** ATTRIBUTE UPDATE *****************************
    % Inner loop to update weights for each attribute:
    
    for j = 1:numAttr
        dH = diffH(j,scaledX,thisObs,Hits,dist1D,sigma)/numUpdates;
        dM = diffM(j,scaledX,thisObs,Misses,dist1D,sigma,classProb)/numUpdates;
        attrWeights(j) = attrWeights(j) - dH + dM;
    end
    %****************************************************************
end





%Helper functions RelieffClass

%--------------------------------------------------------------------------
% DIFFH (for RelieffClass): Function to calculate difference measure
% for an attribute between the selected instance and its hits

function distMeas = diffH(a,X,thisObs,Hits,dist1D,sigma)

% If no hits, return zero by default
if isempty(Hits)
    distMeas = 0;
    return;
end

% Get distance weights
distWts = exp(-((1:length(Hits))/sigma).^2)';
distWts = distWts/sum(distWts);

% Calculate weighted sum of distances
distMeas = sum(dist1D(X(thisObs,a,:),X(Hits,a,:)).*distWts);


%--------------------------------------------------------------------------
% DIFFM (for RelieffClass) : Function to calculate difference measure
% for an attribute between the selected instance and its misses
function distMeas = diffM(a,X,thisObs,Misses,dist1D,sigma,classProb)

distMeas = 0;

% If no misses, return zero
if isempty(Misses)
    return;
end

% Loop over misses
for mi = 1:size(Misses,1)
    
    ismiss = Misses(mi,1:end-1)~=0;
    
    if any(ismiss)
        cls = Misses(mi,end);
        nmiss = sum(ismiss);
        
        distWts = exp(-((1:nmiss)/sigma).^2)';
        distWts = distWts/sum(distWts);
        
        distMeas = distMeas + ...
            sum(dist1D(X(thisObs,a,:),X(Misses(mi,ismiss),a,:)).*distWts(1:nmiss)) ...
            *classProb(cls);
    end
end

% Normalize class probabilities.
% This is equivalent to P(C)/(1-P(class(R))) in ReliefF paper.
totProb = sum(classProb(Misses(:,end)));
distMeas = distMeas/totProb;


function [X,Y] = removeNaNs(X,Y)
% Remove observations with missing data
NaNidx = bsxfun(@or,isnan(Y),any(isnan(X),2));
X(NaNidx,:) = [];
Y(NaNidx,:) = [];


function d = cityblock(thisX,X)
d = sqrt(sum((thisX-X).^2,[2,3]));

（2）电力系统暂态自适应评估程序（PYTHON）

# ----------------------------------------------------
# Description: Class for DynamicLSTM Network
# Created by: Bendong Tan
# Created time: Friday, Jan 25, 2019
# Last Modified: Monday, Jan 30, 2019
# Wuhan University
# ----------------------------------------------------
import os
os.environ['KERAS_BACKEND']='tensorflow'
import time
import numpy as np
from keras.models import Sequential
from keras.layers import Dense,Masking,Flatten,Dropout,LSTM
from keras.preprocessing.sequence import pad_sequences
from keras.utils import to_categorical
from keras.callbacks import ModelCheckpoint
from keras import backend as K
from keras import regularizers


class DynamicLSTM:
    '''
    初始化
    '''
    def __init__(self, X_train, y_train, X_test, y_test):
        n_trainsample, n_timesteps, n_features = np.shape(X_train)
        # 训练数据
        self.X_train = X_train
        # 测试文件
        self.X_test = X_test
        # 训练数据
        self.y_train = y_train
        # 测试文件
        self.y_test = y_test
        # 最后输出
        self.n_outputs = 1
        # 每个时刻的输入特征数量
        self.n_features = n_features
        # 时序持续长度为
        self.n_timesteps = n_timesteps
        # 层数
        self.layer_num = 1
        # 隐含层神经元数目
        self.hidden_size=100
        # 每代训练模型步数
        self.batch_size=n_trainsample
        # 学习率
        self.learningRate = 1e-3
        # 训练代数
        self.epochs=200
        # 保存模型数据目录
        self.storePath = None
    '''
    搭建LSTM网络
    '''
    def build(self):
        # 开始搭建浒关模型
        model = Sequential()
        # 针对自适应评估模式设计补零操作以保持模型输入长度
        model.add(Masking(mask_value=0, input_shape=(self.n_timesteps, self.n_features)))
        # LSTM层
        model.add(LSTM(self.hidden_size,return_sequences=True))
        # 设置dropout防止过拟合
        model.add(Dropout(0.05))
        # model.add(LSTM(self.hidden_size, return_sequences=True))
        # model.add(Dropout(0.05))
        model.add(LSTM(self.hidden_size))
        # sigmoid层
        model.add(Dense(self.n_outputs, activation='sigmoid'))
        # 编译模型
        model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])


        return model
    '''
    训练模型
    '''
    def fit(self,model):
        # 记录最好模型
        filepath = r".\model\model_best.h5"
        checkpoint = ModelCheckpoint(filepath, monitor='val_acc', verbose=1, save_best_only=True,
                                     mode='max')
        callbacks_list = [checkpoint]

        # 训练模型
        model.fit(self.X_train, self.y_train,
                  epochs=self.epochs,
                  batch_size=self.batch_size,
                  validation_data=(self.X_test, self.y_test),
                  callbacks=callbacks_list,
                  verbose=1)

        return model
    '''
    标准评估模型
    '''
    def evaluation(self,model,X_test, y_test):
        _, accuracy = model.evaluate(X_test, y_test,batch_size=len(X_test), verbose=1) # 标准评估准确率

        return accuracy
    '''
    自适应评估模型
    '''
    def Adaptive_TSA(self,model,X_test, y_test,delta):
        miss = 0 # 记录分类错误分数
        right = np.zeros((len(y_test), 20)) # 记录每个样本在每个时刻的评估情况，做了评估记为1
        y_pred = np.zeros((len(y_test), 1)) # 最终评估分类结果

        # 自适应评估过程
        for i in range(len(y_test)):
            for t in range(20): # 最大评估时刻数
                # 如果在时间窗口内采取按照时刻逐步增加采样点的方式进行评估
                if t<self.n_timesteps:
                    Input=pad_sequences(np.reshape(X_test[i,0:t+1,:], (-1,t+1,self.n_features)), maxlen=self.n_timesteps, padding='post')
                    predictions = model.predict(Input)
                    if predictions >= delta and predictions <= 1:
                        right[i, 0:t + 1] = 1
                        y_pred[i] = 1
                        break
                    if predictions >=0  and predictions < 1-delta:
                        right[i, 0:t + 1] = 1
                        y_pred[i] = 0
                        break

                # 如果评估时刻超出时间窗口，则采取滑动时间窗口的方式评估
                if t >= self.n_timesteps:
                    Input = np.reshape(X_test[i, t-self.n_timesteps+1:t + 1, :], (-1, self.n_timesteps, self.n_features))
                    predictions = model.predict(Input)
                    if predictions >= delta and predictions <= 1:
                        right[i, 0:t + 1] = 1
                        break
                    if predictions >= 0 and predictions < 1 - delta:
                        right[i, 0:t + 1] = 1
                        y_pred[i] = 0
                        break
                    # 超出最大时刻的均视为失稳处理
                    if t + 1 == 20:
                        if predictions>=0.5:
                            y_pred[i] = 1
                        if predictions<0.5:
                            y_pred[i] = 0
                        right[i, 0:t + 1] = np.ones((1, t+1))
                        break
        # 计算自适应评估准确率
        for i in range(len(y_test)):
            if y_pred[i]!=y_test[i]:
                miss = miss + 1

        # 记录平均评估时间
        ART = sum(sum(right)) / len(y_test)

        # 记录自适应评估准确率
        Accuracy=(len(y_test)-miss)/len(y_test)*100

        return ART , Accuracy

# TSA, 智能电网, 机器学习

A Novel Temporal Feature Selection for Time-Adaptive Transient Stabiity Assessment

以下为主要实现代码

（1）特征重要性计算程序（MATLAB)

（2）电力系统暂态自适应评估程序（PYTHON）

喜欢这篇文章？打赏一下作者吧

目录

分类

链接

标签云

最新文章

归档

标签

Your browser is out-of-date!