香港正大国际期货有限公司

客服微信 客服微信

行情资讯

探究基差策略在企业套保过程中的量化规则_正大

来源:正大期货    作者:正大国际期货    
2024-03-17 20:35:40   正大期货官网:   正大国际期货:王增益 李红霞

基差作为连接期货和现货的纽带,是判断品种基本面的关键指标,利用基差策略管理标的资产风险和提高投资组合回报率,对企业而言至关重要。我们根据所掌握的期货及现货价格数据,重点研究了安徽省合肥地区螺纹钢套保基差策略及过程逻辑,探索出了适宜操作的量化规则。

[样本数据整理]

根据已知并长期跟踪我的钢铁网合肥马长江螺纹钢HRB400E20mm收盘网价(简称合肥马长江网价)、上海中天螺纹钢HRB400E20mm收盘网价(简称上海中天网价)以及螺纹钢1月、5月和10月3个主要期货合约收盘价2021年年初至今的所有交易日数据,以及合肥马长江螺纹钢HRB400E20mm尾盘库提成交基准价(简称合肥马长江成交价)2023年10月初至今的所有交易日数据,得到样本。

表为样本情况

[相关性分析]

根据期货与现货时间差的定义,对上述样本进行概念区分,通过积差法计算不同类别两组变量的协方差与样本标准差乘积的比值,去计算相关系数,之后结合相关系数甄别样本数据之间的线性关系强弱。计算2021—2023年合肥马长江网价和上海中天网价分别与期货合约收盘价的相关系数r(样本量n1=727)可得结论:上海、合肥两地网价与螺纹钢期货合约收盘价呈高度正相关关系。

表为上海、合肥两地网价与螺纹钢期货合约收盘价的相关性

根据实际情况,希望得到合肥马长江成交价与期货盘面之间的量化函数关系,但受制于尾盘成交价样本量偏少(n2=75),故先对合肥马长江成交价与两地网价的相关性进行确认,再进一步拟合数据。经计算可得,上海、合肥两地网价与合肥马长江成交价也呈高度正相关关系。

[回归性分析]

根据上述相关性分析可以发现,上海、合肥两地网价与期货收盘价之间并无显著相关性差异,需要进一步做回归性分析。将期货价格定义为自变量,将现货价格定义为因变量,通过样本散点图以及数据间逻辑关系,计算样本组一元线性回归关系。同样,也可计算两地网价与合肥马长江成交价的一元线性回归关系。

表为上海、合肥两地网价与螺纹钢盘面的一元线性回归

表为上海、合肥两地网价与合肥马长江成交价的一元线性回归

回归系数的数值表示自变量每单位变化对因变量的影响程度,回归系数越大,自变量对因变量的影响就越大。可以发现,上海中天网价与期货收盘价相比合肥马长江成交价的关联性更强。

[显著性检验]

虽然上海中天网价与其他样本组的关联性最强,但还需对上述线性回归进行检验,无误后,才能选取关联样本(现货价-期货价=基差)进行下一步计算。

在简单线性回归中,主要通过相关指数R2观察线性回归的拟合优度、通过Significance F检验线性关系显著性的P值、通过T查看P-value检验回归方程系数的显著性,以及通过残差分析确定线性回归的前提假设。

表为3组样本的显著性检验

通过上述数据可以发现,P值不仅小于0.05,而且小于0.01,存在极显著差异,说明关联的两组样本总体间存在较强的关联性或者影响力,但通过对残差散点图分布的观察可见,残差的正态性分布特征不足够明显,是这一显著性检验的唯一问题。

根据上述情况,综合实际应用,再次检查样本,考虑到作为自变量的期货收盘价和因变量的现货价存在周期差异,于是,将1月、5月、10月合约收盘价样本根据所处周期重新进行数据挖掘,分为近期(主力连续合约)/中期(距离主力合约最近的1月、5月、10月合约)/远期(距离主力合约最远的1月、5月、10月合约)收盘价样本。

由于上述3组样本总体与前期相比并无变化,故无需再进行相关分析和回归分析,只需将自变量调整为近、中、远周期的3组期货合约收盘价样本,进行显著性检验。

检验数据和前期样本出现基本一致的表现,残差平方和依然较大,表示因变量对预测值的总偏差较大,意味着拟合的效果还不是最理想状态。

表为新的3组样本显著性检验

到这里若继续从线性回归的角度去纠正差异,就需要通过残差散点图去寻找异常点,或者通过最小二乘法、梯度下降法等去求解最小均方差,进而剔除或合并异常值,再重新拟合数据,修正线性回归方程,但得出的是围绕因变量(现货价)的函数公式,并非本次测算目的(基差)的函数公式,且过程复杂。因此,在确认相关样本组具备线性回归关系的前提下,暂停对线性回归方程的修正计算。

[基差正态分析]

根据已获知的样本组之间的线性回归关系,去除异常值后的残差应当具备正态分布特性。推理可知:

注:假设测算日为实际日的下一个交易日;A=(b-1)/b,B=(b-1)/b×Y现货价实际+a/b,A和B均为常数。

根据上述推导,基差测算值显然也具备正态分布特性。

现在只要将关联样本组中的异常值全部去除,残差将完全服从正态分布特征,但由于基差和线性回归样本残差的关联性,基差样本中也必将存在部分异常值。由此可见,目前的基差样本仅存在近似正态分布特性。根据以上情况对前期样本数据继续进行清洗,选取上海中天网价减去近期/中期/远期螺纹钢期货合约收盘价,可以得到3组基差样本数据。

在已知基差样本数据存在异常值的情况下,对2021—2023年所有基差数据绘制直方图。

图为上海中天网价与螺纹钢盘面的基差分布

可以发现,基差样本总体存在明显正态分布特征,而在距离中心较远位置存在部分异常值。仅通过直方图无法对异常值进行科学合理精准处理。

[拟合正态曲线]

根据基差样本数据,分别计算近期/中期/远期期货合约基差样本的平均值和标准差。由切比雪夫定理可知,把n次测量结果的算术平均值作为a的近似值,所产生的误差是很小的。因此,可以通过样本的平均值和标准差去估计正态分布X~N(μ,σ2)的中心值μ和标准差σ,最后代入正态分布曲线方程 f(x)=(1/(σ×(2π)^(1/2)))×e^(-((x-μ)^2)/(2×σ^2)),得到对应基差的概率密度函数。

表为3组基差的概率密度函数

为了更形象地观察基差样本数据分布和概率密度函数曲线,根据  3σ准则,将(μ-3σ,μ+3σ)设为坐标轴两端,再对X~N(μ,σ2) 概率密度函数拟合正态曲线。

图为上海中天网价与螺纹钢近期合约基差正态分布

上海中天网价与螺纹钢近期、中期、远期合约收盘价的基差分布,乍看符合正态分布要求,但超过指定区间的误差不再属于随机误差而是粗大误差,含有该误差的数据就属于异常值,应当予以剔除。同时,对上述各个正态曲线(μ-3σ,μ+3σ)区间范围内数据置信度进行检验,分别为98.07%、98.49%、96.56%,虽已超过95%,具备较高可信度,但并不符合P(|x-μ|>3σ)<=0.003的原则。

[剔除异常值后修正曲线]

通过不断剔除原基差样本组异常值,得到新的基差样本组。

通过计算新样本的平均值和标准差,作为正态分布X~N(μ,σ2)的中心值μ和标准差σ,代入正态分布曲线方程可以发现,中心值μ距离零点更近了,说明剔除异常值后,基差趋于合理回归,同时标准差σ更小了,说明图形离散度更小、数据更集中了。

依然将(μ-3σ,μ+3σ)设为坐标轴两端,对X~N(μ,σ2)概率密度函数拟合正态曲线,同时对各正态曲线(μ-3σ,μ+3σ)区间范围内数据置信度进行检验,分别为99.86%、99.86%、100.00%,完全符合3σ准则要求。

表为剔除异常值后的概率密度函数

[拟定策略]

基差策略实际应用中需要辨别基差所处的范围和回归的概率,故要对概率密度函数进行积分,去求解基差对应的累积概率。

表为基差的累积概率

上海中天网价与合肥马长江成交价存在高度线性正相关关系,但合肥马长江成交价样本仅有75个,仅占基差样本的10.32%。所以,需要等待合肥马长江成交价样本数量达到足够基数,再根据实际情况考虑进行现货价数据拟合或直接更新成交价基差样本数据。根据目前样本可得,上海中天网价-合肥马长江成交价=78(元/吨),在不考虑该地区少量成交价样本误差的情况下,将该数据直接代入累积概率测算发现,近期合约(主力连续合约)的基差受合约到期日影响总体收拢更多,中期和远期合约虽基差走扩,但并不具备远期基差比中期基差走扩更多的特征。下一步根据实际情况,再考虑是否基于时间序列进行基差样本分类或再度优化。

在卖出套保的情况下,当基差≤设定值时,套保比例(持仓策略)≤限定值,此时卖套胜率≥测算值,卖套胜率=1-套保比例×累积概率。

表为卖套基差策略

在买入套保的情况下,当基差≥设定值时,套保比例(持仓策略)≤限定值,此时卖套胜率≥测算值,卖套胜率=1-套保比例×(1-累积概率)。

表为买套基差策略

以上基差策略有效期1年,需每年进行数据更新及策略修正。

我们采用科学的手段和规范的方法,将所需观察和应用的螺纹钢基差进行了量化分析,并且进一步通过梯度概率进行了限仓策略的设定以及相应基差套保胜率的测算,以数据的形式完成了对基差策略的拟定,使得现货买卖和期货下单人员有了直观可见的数据支撑和简易操作的规范流程。如此一来,不仅能更科学地管理风险,而且能通过头寸调整去控制整体波动,进而扩大组合收益。(正大国际期货单位分别为徽商物产、正大期货)

 

 
正大国际期货官网: 马宁
相关新闻
热门文章