摘 要:利用平均電價差值積分模型將電力市場中發電商的機組報價曲線轉換為一維特征向量,從而采用傳統聚類方法對機組報價曲線實現分類。通過對某電力市場的報價曲線聚類計算表明,在平均電價差值積分模型中使用20段分段模型,并采用離差平方和法進行聚類,可以對電力市場中機組的報價曲線實現較準確有效地分類。還可以采用量價指數CPI、HHI指數等方法對聚類結果進行進一步分析。
關鍵詞:電力市場;報價曲線;離差平方和法;聚類分析;HHI指數;量價指數
ClusterAnalysisofPowerProducer''sBiddinginElectricityMarket
Abstract:Anaverageelectricitypricedifferenceintegrationmodelisproposedinthispaper.Thismodelcantransformunit''sbiddingcurveofpowerproducerinmarketintoaonedimensionalfeaturevector,soitcanimplementclassificationofunit''sbiddingusingclassicalclusteringmethod.Throughclusteringcalculationofbiddingcurvefromcertainelectricitymarket,itisshownthatbiddingcurvecanbeclassifiedaccuratelyandefficientlyusing20segmentmodelandsquaresumofdeviationsintheaverageelectricitypricedifferenceintegrationmodel.Moreover,CPI(CapacityPriceIndex),HHIindexcanbeusedtoanalyzethebiddingclusteringresultsfurther.
Keywords:electricitymarket;biddingcurve;squaresumofdeviations;clusteranalysis;HHI;capacitypriceindex
1引言
發電商對電力市場具有重要影響,因此對發電商的報價進行計算分析和分類研究是十分必要的。一般情況下,電力市場中競價上網的發電商個數不會太多,容易形成事實上的寡頭壟斷,所以有關發電商報價策略方面的研究顯得尤為重要。文獻[1~10]采用博弈論、遺傳算法和蒙特卡羅方法等多種算法對發電商的報價策略進行了理論分析和計算,但這些方法側重于對個體電廠進行報價策略指導,通常是一種事前分析,無法勝任電力市場中對電廠報價的宏觀分類和整體分析。實際上從電力市場監管的角度出發,對電廠報價進行整體分類分析具有更大的意義。
將電廠報價進行分類,使電力市場的運行管理部門和監管部門借助電廠報價的分類,采用更細化的定量指標或分析手段進行更具體地量化研究,以監控和監管各種不同報價情況對電力市場的影響,對電力市場的安全穩定運行具有十分重要的意義。截止目前有關電廠報價的分類研究的工作開展得很少,本文主要采用聚類分析的方法進行了研究。然后進一步采用量價指數CPI和HHI指數等方法對報價分類結果進行更具體的研究。
聚類分析是工程上較多采用的分類方法,但是傳統聚類分析方法[11,12]無法直接應用于報價分析,主要是由于電力市場中機組報價是一組分段遞增的報價曲線,而傳統聚類分析方法只能對多維空間中的點集進行分類,無法對一組曲線進行分類。本文提出了平均電價差值積分模型,先對上網電價報價曲線進行數據轉換,再采用聚類分析方法對機組報價進行分類。采用該方法對某電力市場2002年第三季度的報價數據進行了聚類分析,其結果表明,采用平均電價差值積分模型對報價曲線進行數據轉換,可以較好地解決電力市場中報價曲線的分類問題,該方法對發電商的報價進行分類研究是可行的。
2平均電價差值積分模型
聚類分析是數理統計分析中研究“物以類聚”的一種方法。它是將一批樣品或變量,按照它們性質上的親疏程度進行分類。通常有兩種方法:一種是把每個樣品看成是p維空間的一個點,在p維坐標中,定義點與點之間的某種距離;另一種是用相似系數來描述點與點的親疏程度,在確定樣品或變量的相似系數或距離后,可對樣品或變量進行分類。
在某電力市場中,某一時段各發電商的報價數據是2×10維(每個機組分十段報價,每段報價包括段電價和段容量兩個變量),整個電力市場的報價數據為R×2×10維(R為參與競價的發電商數目)。顯然,傳統聚類方法中的方法1或方法2,都無法直接應用于電力市場報價曲線的分類,為此采用下面方法對發電商報價曲線進行數據轉換。
2.1報價曲線的分段量化
首先將報價曲線標么化,機組的報價容量以機組可用容量為基準,電價以電力市場價格上限為基準。只有進行標么化,不同容量機組的報價之間才有可比性。
然后將各發電商的報價曲線分段量化,如圖1所示。把報價曲線容量均勻分成n(n可取10,20,50等)段,用Q*來表示;各段電價標么值用P*來表示;系統年平均上網電價標么值用P*來表示。故有
其中:為電網年(或上一年)平均上網電價(元/(MW·h));
P為機組報價的各段電價(元/(MW·h));
Pul為電力市場的價格上限(元/(MW·h));
AC為機組可用容量;
n為報價容量的分段數。
2.2進行平均電價差值積分得到機組報價曲線的表征向量
?。?)某一時段i的機組報價曲線表征向量
定義差值積分如下:
其中:i表示第i時段;j表示報價曲線分段量化后的第j段。
由此,圖1中的階梯狀報價曲線可轉化為離散的1×n維數組。顯然增大該數組的維數n(分段數),可以更加有效地反映原報價曲線與平均上網電價之間的關系,用Si來表示:
因此,可以用向量Si來表征第i時段的某機組報價曲線。
?。?)一天48個時段(某一天Day)的機組報價曲線表征向量
該電力市場以每半小時為一個時段,全天共分48個時段。對某天48個時段的每個時段進行差值積分處理,可得
顯然,LD較好地反映一天中報價曲線偏離平均電價的變化,可以用來表示一天中上網電價報價曲線的變化。
?。?)某一段時間(1周、一月、一季度、半年、一年等)的機組報價曲線表征向量
將一段時間內每天的LD值進行平均,即可得到一段時段內的相關報價平均值,用來表示:
m—統計時間段內的總天數;
lk,i—表示第k天第i時段的報價曲線表征向量。
可以較好地反映一段時間內平均報價曲線偏離平均上網電價的變化,可用來表示一段時間內上網電價報價曲線的變化。
3聚類分析方法
采用上一節平均電價差值積分模型,可以得到較好地表征機組報價曲線的向量Si、LD或LD,它實際上代表了某一n維空間中的一點,因此可以采用系統聚類法進行分類。報價曲線分類中采用何種聚類方法較好,報價曲線分段量化以多少段為宜,這是本節重點討論的問題。
3.1確定聚類分析方法
對報價曲線采用平均電價差值積分模型進行數據轉換后,再進一步采用系統聚類法對發電商報價進行聚類分析。
系統聚類法是把個體逐個地合并成一些子集,直至整個總體都在一個集合之內為止。它是聚類分析中應用廣泛的一種,凡是具有數值特征的變量或樣品都可以采用該方法進行分類。對發電商報價進行聚類分析的步驟如下:(1)聚類前先對數據進行變換處理,得到表征報價曲線的特征向量。(2)聚類分析處理開始時,先將各樣品自成一類,計算各樣品之間的距離,再將距離近的兩個樣品并成一類。(3)選擇并計算類與類之間的距離,繼續合并直至樣品歸為一類為止。(4)繪制系統聚類譜系圖,按不同的分類標準或分類原則,得出不同的分類結果。在(2)中根據類間距離計算的不同,可以得到多種不同的聚類分析方法:短距離、距離、平均距離、重心距離、離差平方和等??v觀這幾種方法在不同領域中的分類應用效果,通常以離差平方和法的分類效果較好,故選擇離差平方和法進行分類計算。
離差平方和法的分析是:如果類分得合理,則同類樣品之間離差平方和應該較小,類與類之間的離差平方和應該較大。經過上述系統聚類法處理后,得到聚類樹狀譜系圖。借助于該圖,可以直觀地將研究對象親疏關系反映出來。
采用離差平方和法,選取2002年8月14日該電力市場的報價數據進行聚類分析,其中報價曲線分段數取20,電力市場價格上限取820元/(MW·h),聚類計算的分析結果如圖2所示。
結合實際報價數據并參照圖2的聚類結果,可以發現將聚類結果分4類與實際報價情況比較吻合。其中8號發電廠4臺機組的報價,歸為一類;1號發電廠5臺機組報價較高,歸為一類;3號發電廠2臺機組及其他報價次高機組歸為一類;其他報價普遍較低的機組歸為一類。
3.2確定報價分段數目
理論上,報價曲線分段數越多,越能真實地反映原報價曲線,但是分段數過多會造成計算量大大增加,報價曲線分段數究竟以多少段為合適是一個需要進行研究的問題。為此,選取與圖2相同的報價數據,但將分段數由20增加至50,再進行聚類分析(類間距離計算采用離差平方和),分析結果如圖3所示。
比較圖2與圖3,分段數增加僅僅改變了一些很小的分類細節,重要大類并沒有發生實質性的變化,但是當分段數從20段增加到50段之后,不論計算時間還是計算強度都增加很多,因此將報價曲線分成20段已能較真實地反映報價曲線的變化。建議在對機組報價進行聚類分析時采用20段分段。
4聚類計算結果及其分析
選用該電力市場2002年第三季度(7月-9月)的報價數據,采用離差平方和法20段分段進行聚類分析,報價聚類分析結果如圖4所示。
7月份實際報價情況,主要是1號發電廠的機組報價較高。聚類計算結果將報價較高的1號發電廠機組聚為一類,而將報價較低的其他電廠機組聚為另一類,聚類分析計算結果與實際情況是比較吻合的。下面采用量價指數、HHI指數進行更具體的分析。
4.1量價指數分析
4.1.1量價指數CPI(CapacityPriceIndex)定義
量價指數CPI是作者為進行電力市場報價分析而定義的一個指標,它可以較好地反映電廠報價中的高報價行為[13],具體定義如下:
式中:CPIk表示k機組在某時段的量價指數;Pk,i表示k機組在相應時段報價的第i段價格;Cost表示系統平均發電成本;q是冪指數,可以取2~5,通常取3;Ck,i表示k機組在相應時段報價的第i段容量,與Pk,i一一對應;AvailCk表示k機組在相應時段的可用容量。
在高價段,則其量價指數將比正常機組報價的量價指數高出許多,可以反映高價位的容量段。
式中的段價格、段容量都已經轉換為相對值,因此,將某一時段屬于同一電廠的機組的CPI取平均值,得到對應該時段的該電廠的CPI值;又進一步將電力市場中的機組的CPI取平均值,得到對應該時段整個系統的CPI值;再將全天48個時段的CPI取平均值,得到某機組或整個系統當天的CPI值。依此類推就可以得到各月、各季、半年、全年以及某一個任意時段的CPI值。
4.1.2聚類結果的CPI分析
對聚類分析得到的兩類電廠報價分別計算CPI值,如表1所示。
顯然,1號電廠5臺機組的CPI值遠遠高于其它電廠機組,為電力市場全系統平均值的近3倍,為其它電廠機組CPI值的4.55倍。充分反映了1號電廠5臺機組同時采用了高報價策略,對于供電十分緊張的7月份來說,會使電價產生較明顯的升高。統計表明,該月中超過12的時段電價處于漲停位置(價格上限),全月的平均電價超過322元/(MW·h)。
4.2HHI指數分析
HHI指數是經常用來評估市場力的指標,下面采用它們對聚類分類結果進行進一步的分析。
由于1號電廠的5臺機組采用了基本相同的報價模式,可以看作是一臺大機組,占市場競價機組總容量的45,市場份額太大,顯然,此時若采用HHI指數進行計算,它的HHI值就可達2025(尚未考慮其它機組對HHI指數的影響),已明顯超過1800的限值(美國評判標準),呈現出很強的市場力。因此,在夏天電力負荷高峰時期,該電廠的報價對市場電價具有決定性的影響。
綜上所述,由聚類分析結果結合CPI、Lerner指數和HHI指數的分析,可以發現7月份該電力市場存在較強的市場力,并對電價產生影響。
5結論
電力市場中對發電商的報價進行聚類分析,使監管機構能準確及時地掌握各種異常報價行為,以保證電力市場安全穩定地運行。
根據上述分析,可以得到以下結論:
(1)采用平均電價差值積分模型,可以有效地將報價曲線轉換成能較好反映報價曲線變化的一維特征向量,從而對機組報價曲線實現比較準確有效的分類。
(2)對報價曲線實施過多的分段會大大增加計算量和計算時間,但對分類結果沒有太大的影響。在通常的情況下,報價曲線以分20段為宜。
(3)在各種聚類分析法中,以離差平方和法的聚類分析結果好,與實際機組的報價情況比較吻合。
(4)將平均電價差值積分模型和離差平方和法結合,可以對電力市場中的機組報價實施較準確有效的分類。
本文對一組曲線實行聚類分析的方法,對解決其他領域的類似問題具有較好的借鑒意義。
(5)采用平均電價差值積分模型對電廠報價進行聚類分析后,可以進一步采用量價指數CPI、HHI指數等方法對上述結果進行進一步地具體分析。