- Published on
何为 Trader:基本介绍
- Authors

- Name
- RickeeX
世界上最先进的电子交易公司——每秒处理几百万笔交易、同时在一百多个交易所上自动报价——为什么还要雇人坐在那里打电话谈交易?
这个问题是理解期权做市这门生意的钥匙。答案不是「技术还不够好」,而是期权市场的结构决定了某些事情算法做不了:几百万份合约中绝大多数流动性极差,机构订单的规模和复杂度无法用标准电子格式表达,交易对手方的意图需要人来判断,大宗交易的保密性需要私下谈判。
本文阐释做市(market-making)是什么、它为何存在、期权(option)如何运作,以及以期权交易为职业的人每天到底在做什么。贯穿全文的核心问题之一,是自营交易(proprietary trading)公司中两种角色的区别——量化交易员(Quant Trader)和机构交易员(Institutional Trader)—— 以及为什么已拥有世界一流算法交易技术的公司仍然需要人类交易员通过电话与客户谈判。
第一部分:为什么金融市场需要中间人
时间错配问题
假设你有一套房子想出售。你把它挂牌上市。三个月后出现了一位买家。这三个月里,你承担着房子贬值的风险,支付着持有成本,日复一日地等待。这段等待本身就是一种真实的经济成本,即便没有人为此给你寄账单。
金融市场面临同样的问题,只是被压缩到了更短的时间范围。一只管理着数百万人退休储蓄的大型投资基金决定卖出一大批金融合约来调整投资组合。该基金现在就需要卖出,因为投资规则有此要求,或者截止日期迫在眉睫。但就在这个时刻,市场上可能没有人愿意以对应的数量买入那些特定的合约。买家可能明天出现,可能下周出现,也可能永远不会以基金所需的规模出现。
卖方想出手的时间与买方愿意接手的时间之间的错配,是金融市场面临的根本性协调问题。它存在于每个市场、每种资产之中。问题在于如何解决。
一种方案是等待。发布交易意向,等对手方出现时成交。对于热门资产的小额交易,这种方式运转良好。你想买入 100 股苹果公司的股票,几乎可以确定任何时刻都有人愿意卖出 100 股。但当交易规模变大、变复杂,或者涉及的金融工具交易者较少时——交易员将这类工具称为非流动性(illiquid)工具,与买卖双方充裕的流动性(liquid)工具相对——等待时间就会拉长。一只出售 15,000 份专业化金融产品合约的基金,根本无法保证匹配的买家存在,更不用说此刻就存在。
另一种方案是找一个中间人——一个愿意立即站出来承接交易对手方的人,暂时吸纳头寸并管理风险,直到平仓。这个中间人就是做市商(market-maker)。
做市商做什么
做市商是一家公司(历史上也有个人担任),随时准备按照公开报价买卖某种金融工具。做市商不必想要它所承接的头寸。它的角色是提供即时性。你想现在卖出,做市商现在就从你手中买入,之后再设法管理或退出由此产生的头寸。
这不是投机(speculation)。投机者对价格走向形成观点,然后押注于该观点。做市商的谋生之道是承担一种成本——让其他人在他们想交易的时候交易。两种活动在意图上有根本区别,即便表面上有时看起来相似。
做市商报出两个价格:一个买入价(bid),即它愿意从你手中购买的价格;一个卖出价(ask),即它愿意卖给你的价格。卖出价总是高于买入价。你想立即卖出,就以买入价成交;想立即买入,就以卖出价成交。买入价与卖出价之间的差额就是买卖价差(spread)。
买卖价差是做市商为其服务收取的总费用,可以看作即时性的成本。如果买入价是 99、卖出价是 101,做市商以 99 买入,若能在价格对其不利之前以 101 卖出,则每单位赚取 2。实际上,做市商很少能简单地在买入价买入后立即在卖出价卖出。它会承接头寸,持有一段时间,并管理这些头寸在平仓之前价值变动的风险。
买卖价差中嵌入的三项成本
买卖价差不是随意确定的,它反映了做市商承担的三项真实成本。
第一项是逆向选择(adverse selection),即你的交易对手——交易术语叫对手方(counterparty)—— 知道你所不知道的事情的风险。假设某人急切地想大量购买与一家制药公司挂钩的金融合约。如果他们知道该公司即将获得有利的药物审批而你不知道,你卖出合约的那一刻,就会发现自己站在了一个即将大幅升值的头寸的错误一边。买方掌握了信息,你却没有——你被「逆向选择」了。
做市商无法完全规避这一风险,因为他们不可能总是分辨谁是知情者。他们能做的是在买卖价差中收取足够的补偿,以覆盖那些与知情对手方交易而产生的亏损。如果每十笔交易中有一笔是面对知情对手方导致亏损的,那么其余九笔交易的价差就必须足够宽,以覆盖该亏损并让做市商总体仍然盈利。
第二项是库存风险(inventory risk)。做市商一旦承接头寸,该头寸可能在平仓前贬值。假如做市商从客户手中买入 5,000 份合约,而市场在接下来一小时内不利变动,这 5,000 份合约的价值就低于做市商所付出的价格。买卖价差必须补偿在持有期间发生此类不利变动的概率和幅度。
第三项是运营成本(operational cost),涵盖运行做市业务所需的技术、资本、合规监管和人力开支。这些固定和可变成本,必须由全部交易累计获得的总价差来覆盖。
能准确定价这三项成本的做市商将长期盈利;系统性低估这些成本的做市商,将以不充分的补偿承接头寸,最终亏多于赚。
主要参与者
养老基金(pension fund)代表劳动者管理退休储蓄。数百万人向雇主的退休计划缴款,资金汇入养老基金,由其投资于股票、债券和其他资产,使其在数十年间增长。养老基金是世界上最大的投资者之一,通常管理着数千亿美元资产。
资产管理公司(asset manager,有时也称投资管理公司)代表客户——个人、公司或其他机构——从事投资。贝莱德、先锋、富达等都是资产管理公司。它们创建和管理共同基金及交易所交易基金等投资产品。
保险公司(insurance company)在此语境下指大型保险集团的投资部门。大都会人寿或安联等公司向保单持有人收取保费,再将这些资金投入金融市场,以获取支付未来理赔所需的回报。它们的投资组合规模庞大,需要持续管理。
捐赠基金(endowment)是属于大学、医院、博物馆或其他非营利机构的一笔资金。例如哈佛大学的捐赠基金管理着超过 500 亿美元。捐赠基金通过投资收益为机构的运营提供资金。
对冲基金(hedge fund)是一种私募投资基金,通常仅向富裕个人和机构开放,策略范围比传统投资基金更广。对冲基金可能押注股票下跌(而非仅仅上涨),借入资金放大回报,或交易复杂的金融工具。与养老基金或资产管理公司相比,它们往往更具侵略性,也更为隐秘。
投资银行(investment bank,如高盛、摩根士丹利、摩根大通)是为企业和投资者提供多种服务的金融机构。就本文而言,相关的是它们的销售与交易(sales and trading)部门——这些部门历史上代表机构客户充当做市商,买卖金融工具。
自营交易公司(proprietary trading firm,常缩写为 prop firm)用自有资金(而非客户资金)交易金融工具。Optiver、Citadel Securities、Jump Trading、Jane Street 和 SIG 等都属此类。与银行不同,它们不吸收存款、不发放贷款、不提供咨询服务。全部业务就是交易,并在技术和量化方法上大力投入以求做到最好。
最后介绍几个将反复出现的交易术语。当交易员买入(buy)一种金融工具(或称「做多」going long),价格上涨则盈利,下跌则亏损。当交易员卖出(sell)尚未拥有的东西(或称「做空」going short),价格下跌则盈利,上涨则亏损。做空听起来或许奇怪,但它是金融市场中的标准操作,通过借贷安排来实现。交易员的盈亏(profit and loss),缩写为 P&L(读作「P and L」),是其赚得或亏损金额的累计总数。期货合约 (futures contract)则是一种约定在特定未来日期以预定价格买卖资产的协议。期货是最常用于对冲风险的工具之一,在后面讨论做市商如何管理所承接头寸时将频繁出现。
第二部分:什么是期权以及它为什么存在
期权的概念
期权(option)是一种金融合约,赋予持有人在指定日期当天或之前,以指定价格买入或卖出某物的权利,但没有义务。
定义听起来枯燥,背后的理念却既简单又有力。用一个日常类比来说明。假设你正在看一间公寓,喜欢但还没拿定主意。房东同意收取 500 美元的费用,在 30 天内以每月 2,000 美元的挂牌价为你保留这间公寓。如果你决定要,可以按这个价格租下,即便此时同类公寓的租金已涨到每月 2,500 美元。如果你决定不要,走开即可,只损失那 500 美元。那笔费用买来的就是一份期权——按约定价格租住的权利,而没有这样做的义务。
金融期权的运作方式完全一样,只是标的换成了股票、股票指数、债券、货币和大宗商品等资产。对于不熟悉的读者来说,股票指数(stock index)是追踪一组股票综合表现的数值。例如,标普 500 指数(S&P 500)追踪美国最大的 500 家上市公司。人们说「今天市场上涨了」,通常是指标普 500 等股票指数上涨了。期权可以写在股票指数本身之上,使投资者能够押注或防范大盘走势,而无需交易个股。
看涨期权(call option)赋予持有人以指定价格买入资产的权利。假设你持有一份苹果公司股票的看涨期权,行权价(strike price)为 150 美元,你就有权以每股 150 美元买入苹果股票,不论其市价如何。苹果交易价为 180 美元时,以 150 美元买入的权利约值每股 30 美元——以 150 买入后立即以 180 卖出即可实现。苹果交易价为 120 美元时,以 150 美元买入的权利就毫无价值,因为市场上能以低于行权价的价格直接买到。你不会行使这份期权,它将到期作废。
看跌期权(put option)赋予持有人以指定价格卖出资产的权利。假设你持有一份苹果公司股票的看跌期权,行权价为 150 美元,你就有权以每股 150 美元卖出苹果股票。苹果交易价为 120 美元时,以 150 美元卖出的权利约值每股 30 美元。苹果交易价为 180 美元时,以 150 美元卖出的权利就毫无价值,因为市场上可以卖到更高价格。
交易员用来描述期权行权价相对于当前市价位置的术语,值得现在就学习,因为它们将贯穿全文。如果一份期权此刻行权能产生利润,则处于实值状态(in the money)。股价为 180 时,行权价 150 的看涨期权就是实值的。如果此刻行权会亏损——因而没人会去行权——则处于虚值状态(out of the money)。股价为 120 时,行权价 150 的看涨期权就是虚值的。行权价大致等于当前市价时,期权处于平值状态(at the money)。这三个术语描述的是期权距离拥有即时价值有多近,在讨论定价和交易时将反复出现。
每份期权有四个决定性特征。标的资产(underlying)是期权所关联的资产(苹果公司股票、标普 500 指数、原油)。行权价(strike price)是持有人可以买入或卖出标的资产的价格。到期日(expiration date)是持有人必须在此之前决定是否行使权利的最后期限。权利金(premium)是买方预先支付的、用于获取期权的价格。
权利金是获取该权利的成本,购买时支付且不可退还。如果期权到期时未被行使(因为标的资产价格从未朝有利方向变动),买方损失的只是权利金,没有更多。这种不对称性——下行风险有限而潜在上行收益可能很大——正是期权有价值且有意思的原因所在。
期权为什么存在
期权有三项其他金融工具无法复制的经济功能。
第一,保险(insurance)。一只持有 100 亿美元美国股票的养老基金面临市场崩盘导致资产大幅缩水的风险。通过购买标普 500 指数的看跌期权,养老基金获得了在指定水平卖出该指数的权利。如果市场崩盘,看跌期权增值,抵消股票组合上的亏损。为那些看跌期权支付的权利金就是保险的成本。这是机构对期权需求的最大来源——大型资产所有者购买下行保护。
第二,放大的敞口(amplified exposure,在金融领域常称为「杠杆」leverage)。权利金只是直接购买标的资产成本的一小部分,因此期权允许投资者在不投入持有资产所需全部资金的情况下获得对资产大幅变动的敞口。一个看好某只股票将大幅上涨的投机者,可以花少量权利金购买看涨期权,而不必买入股票本身。如果股票大幅上涨,期权的回报率(以所付权利金的百分比计)远超持有股票的回报率;如果股票没有上涨,投机者仅损失权利金。这种放大效应是双向的——投机者可能损失全部权利金,而这在同一时期内的股票投资中通常不会发生。
第三,精准性(precision)。没有期权,投资者只能表达简单的观点:「我认为这个资产会涨」(买入)或「我认为它会跌」(卖出)。期权允许表达远为具体的观点。「我认为这只股票在未来三个月内将在 90 到 110 之间波动。」「我认为市场对未来价格波动的预期目前过高了。」「我想防范崩盘,但愿意放弃超过某个水平的涨幅。」每一种观点都可以通过不同行权价和到期日的期权组合来精确表达。这种精准性正是养老基金、捐赠基金、保险公司和对冲基金等成熟机构投资者成为期权市场主要用户的原因。
期权世界的规模与复杂性
要理解期权交易为什么需要专业化的基础设施和人类的专业判断,看看合约数量的规模就知道了。
一只股票在任何时刻只有一个价格,但这只股票上可能有 30 个不同行权价、12 个不同到期日的可交易期权,每个行权价 - 到期日组合同时存在看涨和看跌两个方向。由此产生 30 × 12 × 2 = 720 个独立期权合约——这仅仅是一只股票。再乘以上市期权的数千只股票、指数和其他资产,合约总量就达到了数百万份。
这些合约中的大多数交易并不频繁。任何一天,只有一小部分可用期权有活跃的买卖双方。其余的要么无人问津,要么买卖价差极宽以至于交易无从发生。这种稀疏性是期权市场的决定性特征之一,也是期权做市面临的核心挑战。
第三部分:期权如何定价
布莱克 – 斯科尔斯模型作为共同语言 1973 年,费舍尔・布莱克(Fischer Black)、迈伦・斯科尔斯(Myron Scholes)和罗伯特・默顿(Robert Merton)发表了一套为期权定价的数学框架,奠定了现代期权市场的基石。布莱克 – 斯科尔斯模型(Black-Scholes model)接受五个输入,输出任何期权的理论价格。这五个输入是:标的资产的当前价格、期权的行权价、距到期日的剩余时间、无风险利率(risk-free interest rate)—— 即最安全的投资能给出的回报,通常是短期政府债券,代表占用资金的基准成本——以及标的资产的波动率。
该模型依赖于在现实中并不完全成立的假设。它假设(among 其他假设)标的资产的价格波动遵循一种随时间恒定不变的特定统计模式,市场在没有交易成本或其他摩擦的条件下运行。没有从业者相信这些假设在字面意义上成立。
那这个模型为什么重要?因为它提供了一种共同语言。交易员不再用取决于行权价、到期日、标的价格和利率的原始美元金额来报价,而是改用隐含波动率(implied volatility)报价。隐含波动率是这样一个预期未来波动水平:将它与其他输入一起代入布莱克 – 斯科尔斯公式,恰好得出期权的当前市场价格。它剥除了所有机械性因素,留下一个代表市场对标的资产未来变动幅度之集体预期的单一数字。
当一个交易员说「4000 行权价的看跌期权在 22 vol 交易」(The 4000 strike put is trading at 22 vol),市场中的每个交易员都确切知道这意味着什么,无论当前股价、到期时间或利率如何。隐含波动率是期权交易员思考的单位。学会用波动率而非美元金额来思考,是区分读过期权知识的人与能流畅推理期权的人之间的那道概念性鸿沟。
波动率:它到底衡量什么
波动率(volatility)衡量的是资产价格随时间的波动幅度。高波动率意味着价格大幅震荡,低波动率意味着价格在窄幅范围内运动。
一只任何给定日期通常上下波动 2-3% 的股票,比一只通常只波动 0.5% 的股票波动率更高。数学上,波动率指年化标准差:如果对数收益率 服从正态分布,步长为 1 年时的标准差就是波动率。波动率的平方(方差)和步长成正比。每年有 252 个交易日,所以日化标准差是年化的 倍,即约 1/16。
说一只股票「波动率为 20%」,意思是在一年的时间跨度内,该股票的价格预计将在当前水平上下约 20% 的范围内波动,大多数日子的波动约为 1-2%。
在期权市场中,有两种波动率很重要。
已实现波动率(realized volatility,也称历史波动率 historical volatility)是回顾性的。它反映标的资产在过去某段时间内的实际价格波动。如果你追踪了一只股票过去一个月的每日百分比变化,已实现波动率就是概括这些每日波动幅度的统计量,为了可比性转换成年化数字。过去一个月内剧烈振荡的股票已实现波动率高,温和漂移的股票则低。
隐含波动率(implied volatility)是前瞻性的,从期权价格中推算得出,代表市场对未来波动率的集体预期。一份三个月期权的隐含波动率为 25%,说明市场在定价中纳入了一个预期——标的资产在未来三个月将表现出约 25% 的年化波动率。隐含波动率不是某个人的预测,而是成千上万市场参与者通过集体买卖期权形成的共识估计。
已实现波动率和隐含波动率之间的关系是期权做市的核心。隐含波动率在长期均值上往往高于已实现波动率,这种现象称为方差风险溢价(variance risk premium)。通俗地说,相对于最终真正发生的价格波动,期权在平均意义上有少许高估。这种溢价的存在原因与保险费超过赔付预期成本相同:期权买方(尤其是下行保护的买方)愿意支付高于统计公允价格的费用,因为在市场崩盘时毫无保护的代价是灾难性的。方差风险溢价是期权做市——操作得当的话——在长期平均水平上盈利的结构性原因之一。
第四部分:希腊字母,或期权价值如何变化
为什么希腊字母很重要
期权价格取决于多个因素:标的资产价格、距到期日的时间、隐含波动率和利率。任何一个因素变化,期权价格随之变动。希腊字母(the Greeks)是衡量期权价格对这些因素变化之敏感程度的一组指标,因各指标传统上用希腊字母命名而得名。
对做市商来说,希腊字母不是抽象的数学概念,而是日常风险管理的语言。承接一个头寸后,做市商首先需要知道:如果标的价格变动了怎么办?波动率变化了呢?时间流逝了呢?希腊字母逐一回答这些问题。管理交易账本在很大程度上就是监控和调整总头寸的希腊字母。
Delta:方向性敞口
Delta(δ)衡量标的资产价格变动一个单位时,期权价格的变动量。一份看涨期权的 delta 为 0.60,意味着标的价格每上涨 1 美元,期权价格约增加 0.60 美元。
Delta 有三种实际解释,一个工作中的期权交易员会在它们之间流畅切换。
第一,delta 是对冲比率(hedge ratio)。这是理解做市商日常工作最关键的解释。假设一个做市商卖出了 1,000 份看涨期权,每份 delta 为 0.60,总方向性敞口为 1,000 × 0.60 = 600 个单位。由于做市商卖出了看涨期权,标的价格上涨时敞口对其不利(看涨期权对买方变得更有价值,对卖方则成本更高)。为消除这种方向性风险,做市商买入 600 股标的股票。股票涨 1 美元,卖出看涨期权的亏损(约 600 美元)与 600 股股票的收益(约 600 美元)大致相抵。此时头寸实现了「delta 对冲」(delta-hedged),对标的价格的小幅变动大致免疫。做市商中和了方向性敞口,可以专注于其他利润和风险来源。
第二,delta 近似于期权到期时处于实值状态的概率(probability)。delta 为 0.60 的看涨期权大约有 60% 的概率到期时有价值(股价高于行权价)。一份深度虚值、delta 为 0.05 的看涨期权大约只有 5% 的概率。数学直觉是:1 美元的涨跌幅被带到行权日之后的数学期望。delta = 0.10 的期权是长线彩票,赢了翻十倍,输了不心疼;delta = 0.30 是典型的投机仓位;delta = 0.80 的深度实值期权基本就用来替代现货。这只是粗略近似而非精确等价,但对快速评估一笔期权交易涉及多大可能性很有用。
第三,delta 反映头寸的方向性敞口(directional exposure)。正 delta 意味着标的上涨时盈利,负 delta 意味着标的下跌时盈利。一个 delta 为零的组合没有净方向性敞口,这正是大多数做市策略的起点。
看涨期权的 delta 范围从 0(深度虚值,到期时有价值的概率几乎为零)到 1(深度实值,到期时几乎确定有价值)。看跌期权的 delta 范围从 - 1(深度实值)到 0(深度虚值)。平值期权——行权价接近当前标的价格——看涨期权的 delta 接近 0.5,看跌期权的 delta 接近 - 0.5。
Gamma: delta 的变化速率
Delta 告诉你当前的方向性敞口,但这个敞口并非静止。标的价格变动时,delta 本身也在变化。Gamma(γ)衡量的正是标的价格变动一定幅度时 delta 变化的速度。
打个比方。如果 delta 是你的速度(头寸价值随标的价格变化的速率),那么 gamma 就是加速度(速度变化的速率)。一辆时速 60 公里但加速度很高的汽车,几秒钟后速度会快得多。类似地,gamma 很高的头寸,在标的价格温和变动后,其 delta 会变得非常不同。
这一点很重要,因为 delta 对冲不是一劳永逸的。已完成 delta 对冲的做市商对小幅变动有保护,但标的价格一变动,delta 就因 gamma 而改变,对冲随之失准。做市商必须调整标的头寸以匹配新的 delta 来重新对冲。这种持续重新对冲的过程叫做动态对冲(dynamic hedging),是期权做市的核心操作活动之一。
Gamma 在临近到期的平值期权上最高,由此带来重要后果。随着到期日临近,平值期权对标的价格的微小变动变得极度敏感。Delta 可以随着标的价格的温和变动,从接近 0 迅速摆动到接近 1(或看跌期权的 - 1)。这就产生了交易员所说的钉住风险(pin risk)。如果到期临近时标的价格恰在行权价附近,期权可能因微小的价格变动而到期毫无价值或极有价值,做市商无法预知结果。对冲变得极其困难,因为所需的对冲量随着每一个小的价格跳动剧烈变化。正因如此,做市商通常在到期前最后几天之前就尝试平仓或调整平值头寸。
Theta:时间的代价
Theta(θ)衡量在其他条件不变时,期权价格每过一天下降多少。所有期权随时间流逝都在损失价值,这种现象叫做时间衰减(time decay)。原因在于期权价值有一部分来自标的资产在到期前可能朝有利方向变动的概率。时间缩短,概率也随之缩小。
对期权持有者而言,朝不利方向波动的可能性,已经通过期权费的方式抹掉了。所以想象空间是单向的,那就是大赢特赢。期权持有者有「亏损封顶」的特权,只要还有时间,波动就是他的朋友。一份还有六个月才到期的权利比只剩一周到期的权利更有价值,因为六个月里能发生的事情更多。每过一天都会移除一点这种「时间价值」,theta 量化的就是每日的侵蚀量。
Theta 在平值期权上最大,随到期日临近而加速。一份在三个月寿命时缓慢衰减的期权,在最后一周会衰减得快得多。
对做市商来说,公司已经卖出的期权,theta 代表收入;已经买入的期权,theta 代表成本。卖出的期权随时间变得不那么值钱,这对卖方有利——以较高价格卖出后期权价值降低,差额即为利润。买入的期权则价值被侵蚀,对买方不利。看似卖出期权简单地更好,但正如下一节将解释的,theta 和 gamma 密不可分:收取 theta 必然要承担 gamma 风险。
Gamma-Theta 权衡
这一关系是理解期权做市如何盈利(或亏损)最重要的单一概念,它把迄今讨论的内容全部串联起来。
一个头寸不可能从大幅价格波动中获益(正 gamma)而同时不因时间衰减而每日损失价值(支付 theta);反过来,一个头寸也不可能稳定收取时间衰减收入(正 theta)而不暴露于大幅价格波动的亏损之下(负 gamma)。这不是大多数时候成立的经验规律,而是嵌入在期权定价结构中的数学事实。天下没有免费的午餐。
直觉如下。如果你买入了看涨期权,同时为了保持 delta 中性,你又做空了一定量的股票。每次股票上涨,你的 delta 变得更正,你需要增加空仓以维持对冲(在高位卖出一些股票);每次股票下跌,你的 delta 变得更负,你可以在更低价格买入一些股票。看跌期权 + 多头的逻辑也是同理。经过多次标的的小幅振荡,期权的持有者会自动从这些低买高卖的重新对冲(re-hedging)交易中累积出利润。这个过程叫做 gamma 交易(gamma scalping),收益取决于标的实际变动了多少(已实现波动率)。
但好处伴随着成本。你每天都在支付 theta,持有的期权随时间贬值。gamma 交易的每日利润必须超过每日的 theta 支出,头寸才能盈利。当标的实际变动超过期权市场的预期——即已实现波动率超过你购买期权时的隐含波动率——这种条件就满足了。
反过来,如果你卖出了期权,你每天收取 theta,这是稳定的收入。但你暴露于标的的大幅变动之下,因为标的变动时你的方向性敞口会朝不利方向偏移。每次变动都迫使你以亏损重新对冲(高买低卖)。theta 收入必须超过 gamma 亏损,头寸才能盈利。当标的变动小于市场预期——即已实现波动率低于你卖出期权时的隐含波动率——这种条件就满足了。
这一权衡在实践中可以直白地说明。一个经过 delta 对冲的期权头寸每天从两个相互竞争的来源获得收益。一个来源是重新对冲的利润(或亏损),取决于标的价格当天实际变动了多少,乘以头寸的 gamma。另一个来源是时间衰减,它消耗所持有期权的价值,并为所卖出期权增添价值。在价格变动小的平静日子里,时间衰减占主导,期权卖方获利;在价格大幅变动的剧烈波动日子里,重新对冲占主导,期权买方获利。两种力量恰好相消的盈亏平衡点,出现在标的的实际每日变动匹配期权价格所隐含的变动水平之时——这正是隐含波动率所代表的含义。
这一权衡是期权做市的经济引擎。它解释了做市商为什么如此关注隐含波动率与已实现波动率的关系,为什么持续监控 gamma 和 theta,也解释了管理期权账本的日常体验为何是 theta 收入的稳定滴流与大幅变动偶尔带来的冲击之间的恒常张力。
Vega:对波动率预测的敏感度
Vega(ν)衡量隐含波动率变动一个百分点时期权价格的变动量。如果你持有期权(「做多 vega」头寸),市场对未来波动率的预期上升时你获利,因为更高的预期波动率使期权更有价值。如果你卖出了期权(「做空 vega」头寸),市场预期下降时你获利。
Vega 在平值、长期限的期权上最高。这些期权对市场波动率预期变化的敞口最大,因为在长时间跨度上预期波动率的变化对期权价值的影响,远大于短时间跨度上同样变化的影响。隐含波动率变动一个百分点对一份六个月期权的影响,远大于对一份一周期权的影响。
对于一个为一大批六个月标普 500 看跌期权定价的机构期权交易员而言,vega 往往是主导风险因素,在对价格的影响上超过 delta 和 gamma。10,000 份合约上仅一个波动率点的定价偏差就可能转化为 150 万美元的误差。波动率评估的精准度对机构规模的交易之所以如此重要,原因正在于此。
高阶希腊字母:简要说明
在 delta、gamma、theta 和 vega 之外,还有更高级的敏感度指标。值得简要提及的两个是 vanna 和 volga。
Vanna 捕捉的是一种交叉效应:隐含波动率变化时,期权的方向性敞口(delta)如何变化。虚值期权的 delta 对波动率假设是敏感的。如果市场开始预期更大的价格波动(隐含波动率上升),一份原本深度虚值的期权在概率意义上不再那么「不可能」进入实值。它的 delta 随之偏移。为大额虚值头寸定价时若忽略了这种交叉效应,就会低估对冲需求。
Volga 捕捉的则是另一个事实:期权对波动率的敏感度(vega)本身也不恒定。随着隐含波动率变化,vega 也在变。对于 vega 是主导风险的超大头寸,这种二阶效应会实质性地影响定价。
提及这些高阶希腊字母是为了完整性。核心希腊字母——delta、gamma、theta 和 vega——驱动着绝大多数的日常交易决策。
第五部分:关键定价关系
看跌 – 看涨平价:看跌和看涨期权本质上是同一个东西
期权理论中最优雅的结论之一是,看跌和看涨期权在本质上并非不同的工具,而是同一种底层期权性(optionality)的两种表达形式,由一个精确的数学关系连接。
该关系适用于所谓的欧式期权(European options),即只能在到期时行权、不能提前行权的期权。(还有美式期权 American options,可以在到期前任何时候行权。这一区别对某些定价细节很重要,但下面的核心逻辑广泛适用。)
其洞察如下。假设你同时买入一份看涨期权并卖出一份看跌期权,两者基于同一只股票、相同行权价、相同到期日。到期时会发生什么?如果股票收盘价高于行权价,你行使看涨期权(以行权价买入股票),看跌期权到期作废,净头寸就是股票减去行权价。如果股票收盘价低于行权价,看涨期权作废,看跌期权被对你行权(你被迫以行权价买入股票,高于市价),净头寸仍然是股票减去一个固定金额。无论哪种结果,你最终都得到了股票减去一个固定金额。
再看另一个策略。你今天直接买入股票,并借入一笔等于行权价的金额(根据期权存续期内的利息调整,因为你在到期之前不必支付行权价)。到期时,你仍然得到股票减去偿还贷款的金额,即行权价。
两个策略在所有情境下产生完全相同的结果。结果相同,今天的成本也必须相同。这意味着看涨期权的价格减去看跌期权的价格,必须等于当前股价减去行权价的现值。如果这一关系被打破——哪怕短暂地——交易员就可以同时执行两个策略赚取无风险利润,即套利(arbitrage)。在流动性好的市场中,交易员持续监视这一关系,对任何偏离立即交易,直到价格回归一致。
实际意义十分显著。持有股票并卖出看涨期权的策略(「备兑看涨」covered call),事实上与单纯卖出一份看跌期权的风险特征相同。持有股票并买入看跌期权做保护的策略,与持有现金并买入看涨期权的特征相同。每个期权头寸都可以用这一关系分解为等效的组合。这意味着所有期权头寸在本质上都是波动率交易。方向性分量(标的涨还是跌)总可以通过买卖标的本身来复制。期权的独特贡献是「时间价值」或期权性,而这一分量对于同一行权价和到期日的看跌和看涨期权是完全相同的。
波动率曲面
如果布莱克 – 斯科尔斯模型完全正确,同一标的上所有期权的隐含波动率将相同,与行权价或到期日无关。但现实并非如此。隐含波动率在行权价和到期日两个维度上均存在差异,如果绘图则形成一个三维景观。交易员将此称为波动率曲面(volatility surface)。
行权价维度上的偏斜。在权益类市场中,虚值看跌期权(行权价远低于当前市价)的隐含波动率一致地高于虚值看涨期权(行权价远高于当前市价)。这种模式称为波动率偏斜(volatility skew)。
两股力量驱动偏斜。第一,机构对下行保护的需求。养老基金、捐赠基金和保险公司集体持有数万亿美元的股票,并经常性地购买看跌期权以防范崩盘。这种巨大且持续的需求推高了虚值看跌期权的价格(因而也推高了其隐含波动率),效果类似于沿海城镇所有人同时想买洪水保险——保费上涨,因为需求超过供给。第二,有真实的经济理由预期股价下跌时波动率更高。公司股价下跌时,债务不变,相对于缩水的股本,公司变得更加负债累累。负债程度更高的公司往往股价波动率更高。更低的股价确实对应着更高的未来波动率,从而为更低行权价处更高的隐含波动率提供了合理性。
到期日维度上的期限结构。平值行权价处的隐含波动率因到期日不同而不同。正常市场条件下,期限结构呈上升倾斜——长期限期权的隐含波动率高于短期限期权。六个月的时间跨度比一周有更多不确定性,这在直觉上说得通。在危机期间,关系倒转——短期限隐含波动率飙升至长期限之上,因为市场在为迫在眉睫的危险定价。可以将其比作天气焦虑与气候焦虑的区别:飓风预警(短期危机)产生即时恐慌,长期气候趋势产生稳定但程度较低的担忧。
曲面如何运动。波动率曲面并非静态。它会因新信息、期权供需变化和更广泛市场条件的改变而移动。交易员使用简化模型来描述标的价格变化时曲面如何运动。一种模型假设给定行权价处的隐含波动率在标的变动时保持不变(曲面「锚定」在特定行权价水平上);另一种模型假设隐含波动率相对于行权价距当前价格的距离保持不变(曲面随标的同步运动)。两种模型都不完全准确,但提供了有用的近似,占主导的行为模式会影响对冲决策。
理解波动率曲面对机构期权交易员来说并非可有可无。当一只养老基金为 50,000 份标普 500 看跌期权请求报价,且行权价远低于当前市场水平时,交易员必须按照偏斜所决定的较高隐含波动率为那些看跌期权定价,而非按平值波动率。在这种规模的交易上,偏斜定价偏差哪怕只有半个波动率点,也会转化为巨额金额误差。
第六部分:市场微观结构,或交易的隐藏管道
逆向选择的实践
逆向选择的概念在第一部分作为买卖价差中三项成本之一被引入,但它值得更深入的讨论,因为它几乎塑造了期权做市商面临的每一个定价决策。
做市商收到交易请求时,最要紧的问题不是「理论价格是多少?」——定价模型毫秒内就能回答——而是「这个人为什么想交易?」这个问题的答案决定了做市商实际承担多大的风险。
考虑两种情形。第一种:一只大型养老基金需要调整投资组合,原因是其股票配置比例已超出投资政策允许的范围——也许近期股票上涨,在总组合中占比过大。养老基金作为调仓的一部分卖出看涨期权。它的动机与对价格走向的看法无关,纯粹是机械性的,由规则和组合目标驱动。对做市商而言,这是低信息含量的交易流(low-information flow)。这笔交易带有库存风险和运营成本,但逆向选择风险很小,做市商可以报出相对较窄的价差。
第二种情形:一只以成功的方向性押注闻名的对冲基金,突然要求对单只股票的大量虚值看涨期权报价。该基金可能掌握了某些信息——也许是即将发生的收购、产品发布或尚未公开的监管决定。如果做市商卖出了那些看涨期权而事件成为现实,亏损可能是巨大的。这是高信息含量的交易流,逆向选择风险极高。做市商必须报出更宽的价差来补偿,或者干脆拒绝报价。
难点在于做市商交易时无法确切知道自己面对的是哪种情形。随着时间推移,做市公司会对每个对手方的历史行为建立详细档案。它们追踪哪些对手方的交易往往能预测未来价格变动——行业内称之为「有毒流」(toxic flow),意味着对手方似乎在利用做市商不掌握的信息交易;也追踪哪些对手方的交易不具预测价值 ——「良性流」(benign flow),意味着对手方因再平衡或对冲等常规原因交易。这些数据直接输入定价决策:有有毒流历史的对手方收到更宽的报价,有良性流历史的对手方收到更窄的报价。这不是针对个人的对抗,而是基于证据对风险合理定价。
对手方画像
随着时间推移,做市台积累了关于每个对手方行为模式的丰富数据。这个对手方的交易活动是否倾向于预测未来价格变动?如果是,做市商与其交易时需要收取更宽的价差,因为其中相当比例的交易很可能基于最终被验证正确的信息或分析。如果不是,做市商可以收取更窄的价差并争取该对手方更多的业务,因为中介其交易流是盈利的。
这一数据集是公司最有价值的资产之一,因为它使公司对逆向选择的定价比缺乏同等数据的竞争对手更准确。更精准的逆向选择定价意味着:公司可以向常规对手方报出更窄的价差从而赢得更多交易流,同时仍能防范知情对手方、避免亏损。一家没有这种积累数据就进入市场的新公司处于明显劣势,这也是既有做市商难以被取代的原因之一。
价格冲击:永久性与暂时性
一笔大型大宗交易执行时,会推动市场价格。但并非所有价格变动性质相同。
一部分冲击是永久性的,代表真实的新信息被纳入市场价格。如果一只消息灵通的对冲基金因正确预见了一个正面事件而大量买入看涨期权,由此产生的价格上涨反映了真实信息,价格不会在交易之后回落。
一部分冲击是暂时性的,代表吸收大额订单的机械压力,随着其他市场参与者介入和市场回归自然均衡而消散。如果一只养老基金因常规再平衡而卖出大量看跌期权,纯粹由卖压规模引起的初始价格下跌是暂时的——这次卖出不传达关于价格应该在哪里的信息,市场价格往往在随后的数小时或数天内恢复。可以打个比方:一块大石头扔进池塘,水花很壮观,但水位终归会回到原来的位置。
对期权大宗交易的研究表明,来自机构的卖出订单(通常出于再平衡或对冲目的)往往主要产生暂时性价格冲击。这一发现有直接的实践意义。如果做市商认为一笔交易的价格冲击可能是暂时性的,就可以报出更窄的价差——因为它预期短期的价格压低会随着市场稳定而反转,耐心的对冲将捕捉到这一恢复。如果冲击很可能是永久性的(因为对手方基于真实信息在交易),做市商就需要更宽的价差,因为价格不会回来了。
第七部分:为什么期权仍然需要人类交易员
四个结构性原因
现代金融技术每秒能执行数百万笔交易、实时管理复杂的风险计算、同时在数千种工具上报价,一个自然的问题随之而来:为什么计算机不能包办所有期权交易?在普通股票市场(交易员所称的「现货股票」cash equities)中,计算机基本上可以——如今大部分股票交易量通过电子方式完成,算法同时在数千只股票上报价并管理库存。但期权在结构上与股票有四点不同,使得完全自动化不够用。
第一个原因是产品空间的庞大规模。如第二部分所讨论的,一只股票可能对应 720 份独立的期权合约。其中大多数流动性很差,交易太少,算法几乎没有数据可用。算法可以在少数流动性合约(最近到期日的平值期权)上报出窄幅、有竞争力的市场,但期权世界绝大多数合约交易太少,无法支撑完全自动化的做市。当一个请求要求对一个很少交易的行权价和到期日的 5,000 份合约报价,且没有近期交易活动时,算法可能报不出可靠的价格,或者报出的价格宽到毫无用处。一个人类交易员,凭借对波动率曲面、希腊字母以及该合约与附近更具流动性合约之间关系的理解,可以在算法无法做到的地方给出有意义的价格。
第二个原因是机构订单规模大、结构复杂且需要谈判。当一只养老基金想要同时买入看跌期权获得下行保护并卖出看涨期权为其融资(一种常见的组合策略),基于 5 亿美元的股票敞口、横跨多个到期日时,这不是能在电子屏幕上发布的订单。这笔交易涉及多个价格相互关联的组件——看跌期权的价格部分取决于看涨期权的价格,因为看涨期权的权利金被用来支付看跌期权的费用。规模大到暴露就会推动市场。对手方对结算时间、对冲窗口和监管报告有特定的执行要求。这种交易需要对话:对手方要解释需求,做市商要从整体上评估风险,双方要谈判条款。这种谈判需要人类的判断力和人际交往技巧。
第三个原因是期权交易流的信息含量需要人类来解读。当一只对冲基金突然要求对一家生物技术公司 20,000 份虚值看涨期权报价时,定价模型毫秒内就能算出理论价值。但关键问题不是「理论价格是多少?」而是「这个人为什么要买这些看涨期权?」如果对冲基金掌握了关于即将到来的药物试验结果的保密信息(尚未公开),公允价格远高于模型所示——因为看涨期权变得有价值的可能性远比模型假设的要大。如果对冲基金是在对冲一个押注该股票下跌的现有头寸(即第一部分引入的「做空」头寸),公允价格则接近理论价格,因为看涨期权是出于风险管理目的而非因为买方预期股票上涨而购买的。人类交易员通过对该对手方典型行为的了解、更广泛的市场背景(该公司的股票是否有异常活动?)以及近期交易流的模式来做出判断。目前没有任何算法能复制这种判断,因为它取决于关系、声誉和对人类意图的情境解读。
第四个原因是保密性。如果一只养老基金打算卖出 3 亿美元标普 500 看跌期权的意图在执行前被公开,其他市场参与者就会争相在该订单前面交易,在养老基金完成出售之前压低价格。这种掠夺性行为被称为抢先交易(front-running),而「楼上市场」(upstairs market)——大宗交易发生的私密谈判空间——存在的目的正是为了防止它。交易在机构和做市商之间私下谈判,以约定价格执行,仅在完成后才向交易所报告。人类中间人使这种私下谈判成为可能。
第八部分:机构期权交易如何运作
报价请求
报价请求(Request for Quote, RFQ)是目前大多数机构期权交易发生的机制。理解这一流程,对于理解机构期权交易员每天在做什么很有帮助。
RFQ 的运作方式如下。一个机构客户(养老基金、资产管理公司、保险公司或对冲基金)决定需要执行一笔期权交易。客户的执行团队通过专门为此设计的电子平台提交请求。(具体平台包括彭博 Bloomberg 的 RFQ 系统、Tradeweb 以及交易所运营的系统。具体品牌名称不如理解实质重要——这些本质上是电子市场,客户的请求在其中被同时广播给多个做市商。)请求指定了工具(哪个期权,什么行权价和到期日)、规模(多少份合约)和方向(买入或卖出)。有时客户仅指定工具和规模,故意不披露方向,以防止做市商提前调整价格对客户不利。
平台将此 RFQ 同时发送给多个已注册为流动性提供者(liquidity provider)的做市商——即承诺以可执行价格回应 RFQ 的做市商。通常三到五家公司同时收到请求,每家必须独立评估该交易并以报价回应。
做市公司内部发生了什么
RFQ 到达后,机构交易员的流程在几秒到几分钟内展开,取决于交易的复杂程度。公司的量化定价引擎已经基于当前的波动率曲面、标的价格、利率和希腊字母算出了期权的理论公允价值。这个理论价格是起点,而非答案。交易员接下来要做一系列模型本身无法完成的调整。
第一项调整是对冲成本。如果公司承接了 15,000 份看跌期权合约,就需要通过购买标的资产来对冲由此产生的方向性敞口——通常通过期货合约(第一部分引入的那种在未来日期以约定价格买卖的标准化协议)。执行该对冲的成本——包括对冲交易本身的市场冲击——是一项真实成本,必须反映在报价中。如果标的流动性好(如标普 500 期货,每天有巨量交易),且所需对冲量相对于每日交易量不大,这项成本较小。如果标的流动性差(如一家较小公司的股票,日交易量低)或所需对冲量非常大,对冲成本就相当可观,必须相应纳入定价。
第二项调整是逆向选择。交易员评估对手方的身份和可能的动机。一只做常规季度再平衡的养老基金,逆向选择风险低。一只有着准确方向性押注历史记录的对冲基金,逆向选择风险高。后一种情况下,价格要调宽,以补偿处于知情交易错误一方的更大概率。
第三项调整是库存影响。公司旗下所有交易台已持有一个期权头寸组合。新增 15,000 份标普 500 看跌期权会影响公司总体的希腊字母敞口。如果现有组合在同一方向已有大量头寸(比如公司在标普 500 上从其他交易中已积累了大量 gamma),再增加同向头寸会加剧该风险上的集中度,价差必须更宽以作补偿。如果现有组合有方向相反的敞口,新交易实际上通过提供天然对冲而降低了公司总体风险。此时公司可以报出更窄的价差,因为该交易使组合更安全而非更危险。这正是运营大型、多元化做市业务的结构性优势之一——交易流越大越多元,任何单笔新交易抵消组合中其他持仓的可能性就越大。
第四项调整是竞争态势。交易员知道其他几家做市商同时收到了同一 RFQ。定价过宽意味着将交易输给报出更好价格的竞争者。定价过窄意味着赢了交易却未获得足够的风险补偿——这比失去交易更糟,因为你最终持有了一个预期亏损的头寸。均衡点在于以一个真实反映公司成本和风险评估的水平定价,有足够的边际利润(edge)来证明投入资本的合理性,但又足够窄以保持竞争力。
交易员输入报价,平台将其与其他做市商的竞争报价一起发送给客户,客户以最优价格执行。整个过程——从接收 RFQ 到执行——一笔简单的单一期权交易可能只需 30 秒,需要反复协商的复杂多组件结构可能需要几分钟。
第九部分:交易执行之后发生了什么
交易执行是开始,不是结束
交易执行的那一刻不是流程的终点,而是一个风险管理问题的起点。一旦做市公司从客户手中承接了 15,000 份标普 500 看跌期权合约,公司立即在多个维度上产生了敞口。
它有 delta 敞口,意味着公司现在受标普 500 指数走势的影响。如果指数下跌,公司承接的看跌期权变得更有价值(买入了则有利,卖出了则不利)。
它有 gamma 敞口,意味着随着标普 500 变动,delta 随之变化,需要持续的对冲调整。几分钟前设置的对冲已经开始偏离。
它有 vega 敞口,意味着如果市场对未来波动率的预期升降,那 15,000 份看跌期权合约的价值会相应变化,幅度可能很大。
它还有 theta,意味着期权仅仅因为时间流逝而每天损失价值。如果公司卖出了看跌期权(收取时间衰减),这对公司有利;买入了(支付时间衰减),则对公司不利。
Delta 对冲
Delta 对冲最先执行,通常在交易完成后几分钟内。公司买入或卖出标普 500 期货合约,数量足以中和方向性敞口。对冲完成后,公司的头寸对标普 500 的小幅变动大致免疫。
这种对冲在设计上是不完美的。由于 gamma 的存在,delta 随标的价格变动而变化,对冲持续偏离。公司的量化模型决定最优的重新对冲频率,在每次重新对冲的交易成本(佣金、市场冲击、对冲工具的买卖价差)与对冲不足的风险之间权衡。重新对冲太频繁,交易成本侵蚀利润;太不频繁,头寸承担超出预期的方向性风险。
管理 vega
Vega 敞口的管理时间跨度比 delta 更长。如果公司想要降低 vega,可能卖出其他具有类似 vega 敞口的期权,或者等待未来数小时和数天内来自其他对手方的自然抵消交易流。
这就是集中风险账本(central risk book)概念变得重要的地方。做市公司将所有交易台的风险汇总。机构交易台的一个看跌期权头寸可能抵消了电子做市台的一个看涨期权头寸,无需执行任何额外市场交易就降低了公司的净 vega 敞口。这种内部净额轧差头寸的能力是一个显著的效率优势,因为它省去了在公开市场上对冲的交易成本。
Theta-Gamma 张力
管理期权账本的日常体验围绕着第四部分描述的 theta 与 gamma 之间的张力展开。如果公司卖出了期权(做空 gamma),它每天收取 theta 收入,但标的一旦大幅变动,gamma 亏损可能超过累积的 theta。如果公司买入了期权(做多 gamma),它每天支付 theta,但从标的的大幅变动中获利。
机构交易员在这种交易后风险管理中的角色不是手动执行每一次对冲调整——大部分对冲是自动化的。交易员确认一笔大宗交易后,公司的算法系统就按照交易员指定的参数以最小的市场冲击处理 delta 对冲(市场快速变动时激进对冲,不紧急时耐心对冲)。交易员的价值在于监督风险整合、标记异常情况,以及做出算法无法做出的判断。如果一个重大经济事件冲击市场,需要将 delta 对冲加速到超出算法正常参数的程度,交易员会升级处理。如果对手方回电要求修改或解除部分交易,交易员负责谈判。如果公司的总 vega 大到令人不安,交易员会与其他交易台协调寻找抵消交易流。
第十部分:为什么电子做市公司建立了人工交易台
这也许是理解机构期权交易是什么以及它为何重要的最具揭示性的问题。Optiver、Citadel Securities、Jane Street 和 SIG 等公司是世界上最先进的电子交易机构。它们运行的算法同时在一百多个交易所上报价,跨数百万种工具自动对冲和管理风险。这些公司已投入数十亿美元于技术基础设施,目的就是让计算机完成交易工作。那么,它们为什么还要雇用通过电话谈判交易的人类交易员?
答案有五个层次,每层建立在上一层之上。合在一起,它们不仅解释了这个角色为什么存在,还解释了它为什么有战略重要性。
第一层:捕获无法电子化的交易流
电子订单簿(electronic order book)—— 买卖订单由计算机自动匹配的系统——对标准化的中小规模订单运转良好。你想买 50 份期权合约,在挂牌的行权价和到期日?算法可以在毫秒内为你报价、执行交易并对冲结果头寸。但主要市场中大约 30-40% 的期权交易量不在电子订单簿上成交,而是通过「楼上市场」中的协商大宗交易——即第七部分描述的私密、对话式渠道。这些交易要么规模太大而无法在屏幕上执行而不推动价格,要么太复杂而无法用标准电子订单格式表述,要么太敏感而不能在完成前暴露给市场。一家纯电子交易的公司被完全锁在这整个细分市场之外。建立一个机构交易台使公司得以接触到否则永远看不到的交易流。
第二层:大宗交易上更高的单笔收入
在电子订单簿上,做市公司在极窄的价差上每份合约可能只赚几美分,靠巨大的交易量(数百万份合约)来产生利润。机构大宗交易上,每份合约的补偿则显著更高。补偿做市商对冲成本、逆向选择风险和库存影响的更宽价差,意味着每份合约比电子交易更多的收入。机构交易台的利润率结构与电子业务不同,二者互补。
第三层:机构交易台是一个信息引擎
每次养老基金对冲其股票组合、对冲基金建立方向性头寸,或保险公司通过机构交易台重组其期权账本时,公司都能看到。将数百个对手方在数月乃至数年间的交易流模式汇总起来,揭示出关于机构持仓、对冲需求和波动率预期的信息——这些信息对只在电子屏幕上交易的人不可见。
这些信息对公司的其他业务极其有价值。如果机构交易台观察到多家大型资产管理公司同时买入下行保护,这个关于整体机构恐惧情绪的信号就反馈到量化模型和电子定价算法中。公司可以据此调整波动率预测,重新配置对冲,并可能在信心增强的地方收窄电子报价。一家主要公司将这种动态描述为「将风险内部消化并循环利用」的能力——来自一个客户交易流的更好信息使得对下一个客户的定价更好,形成自我强化的循环。
第四层:通过关系构建竞争护城河
随着自营交易公司扩张到机构市场,它们已经在银行无法在速度、技术或资本效率上竞争的领域取代了银行。银行现在经常联系自营交易公司来帮助对冲短期限期权头寸的风险、调整现有头寸或清理零散规模的敞口。机构交易台将这一动态延伸到了买方(buy side)—— 即养老基金、资产管理公司和保险公司这些期权的最终用户。公司建立的每一个机构关系都通过增加交易流、信息和品牌认知来加深竞争护城河。这些关系不断积累,使新进入者越来越难以竞争。
第五层:跨公司的风险回收
公司运行一个集中风险账本,汇总所有交易台的头寸(电子做市、机构、ETF 和股票交易台)。ETF,即交易所交易基金(Exchange-Traded Fund),是将许多股票打包成单一可交易工具的产品,将在第十六部分完整解释。当机构交易台从一个对手方承接了一个大的看跌期权头寸时,该头寸可能部分抵消了电子交易台从挂牌市场积累的看涨期权头寸。这种内部净额轧差降低了公司的总风险和对冲成本,创造了单一策略公司无法复制的效率。
公司的交易流越大越多元化,内部抵消就越多,公司就能在未来的交易中报出更窄的价差,从而吸引更多交易流。这就是使大型多交易台做市公司拥有结构性优势的飞轮效应:更多交易流带来更多内部净额轧差,进而带来更窄的定价,再吸引更多交易流。每个新交易台(电子、机构、ETF、股票)都通过为总账本增加多样性来增强其他交易台。
第十一部分:机构期权交易员的日常
不确定性下的具体决策
抛开理论,看看决策本身。在任何一个交易日,一个机构期权交易员都在做出如下判断。
不确定性下的定价。一个经纪人打来电话,要求对 8,000 份跨式期权(straddle)—— 一种在同一行权价上同时包含看涨和看跌期权、从任一方向大幅变动中获利的组合——报价,标的是一个欧洲股票指数,三个月后到期。量化模型显示了理论中间价。交易员必须决定需要多少「边际利润」(edge,即公司为承担风险所需的补偿)。答案取决于:当前隐含波动率水平相对于交易员认为它应该在的水平如何、对冲成本(标的能否以低成本快速对冲?)、对手方的历史信息含量(这是一个常规账户还是一只交易往往能预测未来价格的基金?),以及公司账本的当前状态(交易台在欧洲指数上是否已经在同一方向有大量敞口?)。所有这些必须在大约 60 秒内综合成一个价格。
读懂局势。一个公司合作多年的对手方突然开始要求对单只股票的看跌期权策略(即从特定股票下跌中获利的头寸)报价,而这只股票一直很平静。交易员注意到这对该对手方来说不寻常。这家公司是否有什么正在发生而交易员不知道的事?是否有研究报告发布了?是否有传闻在流传?交易员在报价前先调查——查看新闻推送,查看其他对手方是否在同一标的上活跃,并可能加宽报价以反映对手方可能掌握信息这一增加的不确定性。这种情境意识——注意到某些事情不符合通常模式并据此行动——是一种独特的人类技能。
管理关系与价格张力。一家代表大量经常性业务的大型资产管理公司要求一个交易员知道在当前市场条件下比公司能盈利报出的水平更窄的报价。交易员必须在长期关系的价值(这个对手方今年可能交易 500 次,汇总起来是盈利的)与在这笔特定交易上亏损的成本之间做出平衡。正确做法通常是报出一个公允但坚定的价格,坦率解释为什么今天价差需要更宽(也许波动率升高了,或者标的流动性异常地差),在不放弃公司利润边际的前提下维护关系。这种谈判同时需要温暖、可信度和纪律。
实时更新信念。交易日中,一家央行出乎意料地发出了货币政策转向的信号(例如暗示利率将比预期更早变动)。利率波动率飙升,股票波动率跟随,波动率曲面的期限结构倒转(短期限隐含波动率升至长期限之上,标志着急性的短期焦虑)。交易员的整个定价框架必须立即更新。一小时前还正确的报价现在已经过时。量化模型会重新校准,但在公告发布后的最初几分钟里,是交易员的判断在阻止公司以昨天的价格在一个已根本改变的市场中报价。交易员必须加宽价差以反映增加的不确定性,同时管理现有账本在新体制下的敞口。
决定不交易什么。并非每个 RFQ 都值得给出有竞争力的价格。如果一个以有毒流著称的对手方在交易员怀疑存在显著信息不对称的股票上发来 RFQ,正确的决定可能是报出非常宽的价差(实质上是拒绝交易)或者完全不参与。知道何时说不,与知道如何定价同样重要。面对表面看起来盈利但隐含了隐藏风险的交易能保持走开的纪律,是区分经验丰富的交易员和新手的品质之一。
交易后的头寸管理。交易日结束时,交易员审查交易台的累积头寸。也许由于保险公司一天的大量看跌期权卖出,公司现在在欧洲股票上持有大量净 vega 敞口。交易员评估:这一敞口是否在公司的风险限额之内、明天是否可能到达自然的抵消交易流,以及是否需要在隔夜交易时段之前采取任何对冲行动。这一审查输入到次日晨会,交易台在晨会上为即将到来的一天制定策略。
第十二部分:机构交易台如何融入公司
内部生态系统
机构期权交易员并非孤立运作。这个角色处于几个内部职能的交汇处,而这些职能之间的互动与交易员的个人决策同等重要。
量化模型提供定价基础。量化研究员构建和维护波动率曲面,校准希腊字母,开发公司用于自动在交易所报价和管理风险的算法。机构交易员将这些模型作为输入,但在其上叠加人类判断。模型说一个期权的理论公允价值是 X,交易员决定是报 X,还是 X 加一个风险溢价,还是 X 减一个折扣以赢得竞争性 RFQ。模型提供起点,交易员给出最终答案。
自动化交易系统处理对冲执行。机构交易员确认一笔大宗交易后,由此产生的 delta 对冲通常由公司的自动化系统处理。这些系统可以在标的市场中买入或卖出期货、股票或交易所交易基金,以最小的市场冲击,使用为执行质量优化的算法。交易员指定参数(市场波动大则快速对冲,不紧急则耐心对冲),但执行本身是算法化的。这种分工体现了一个更广泛的原则:人类做人类最擅长的事(判断、谈判、情境评估),计算机做计算机最擅长的事(快速、精确地执行定义明确的任务)。
集中风险账本汇总敞口。公司维护一个实时的、全公司范围的希腊字母敞口视图,使跨交易台的内部净额轧差成为可能。机构交易员的头寸与每个其他交易台(电子做市、ETF 交易、股票交易)的头寸一起输入这个账本。风险管理团队监控汇总情况,并在公司任何维度(delta、gamma、vega)的总敞口接近限额时发出预警。
技术和数据基础设施支撑一切。交易员在专有软件中操作,该软件实时显示波动率曲面、对手方分析、头寸希腊字母和 RFQ 队列。这一基础设施的速度和可靠性直接影响交易员竞争性回应 RFQ 的能力。一家在向交易员显示更新后的波动率曲面上拥有两秒优势的公司,能比系统较慢的竞争者更快、更准确地报价。
盘后项目工作。在实时交易时段之外,机构交易员参与改进公司的系统,包括构建分析仪表盘、分析历史交易数据以识别模式或改进空间,以及开发使未来交易更高效的工具。机构交易员既是公司交易基础设施的使用者,也是建设者。
第十三部分:量化交易员与机构交易员
两个角色,一家公司
在期权做市的自营交易公司中,通常雇用两种不同类型的交易员。两者都坐在交易大厅,都使用相同的量化模型,都向同一个集中风险账本贡献头寸。但他们日常工作的性质、依赖的技能和解决的问题有着根本区别。量化交易员(Quant Trader, QT)与机构交易员(Institutional Trader, IT)之间的区别是这些公司运营中最容易被误解的方面之一,理解它需要前面各部分建构起来的全部内容。
量化交易员
量化交易员的领域是电子订单簿。他们的工作是构建、校准和监督公司用于在交易所上自动报价和管理风险的量化模型和算法。
QT 的典型一天包括:研究公司波动率曲面模型的行为、调查为什么算法在某个特定合约上定价偏差或未能捕获预期的利润边际,以及编写或完善驱动公司自动交易的代码。QT 可能注意到公司关于标的价格下跌时波动率曲面如何运动的模型(第五部分讨论的隐含波动率是锚定在特定行权价还是随标的同步运动的问题)与近期观察到的行为不匹配,然后花一天时间建立统计检验以确定模型是否应该重新校准。
QT 的工作在数学和计算上有很深的要求。问题涉及模型精确度、统计边际利润、执行效率和系统稳健性。对手方实际上是匿名的市场。QT 不知道也不关心电子交易对面是谁——重要的是算法的价格相对于模型是正确的、对冲执行高效、系统能优雅地处理异常情况(市场活动骤降、交易所故障、相关市场联动)。
QT 的主要工具是编程语言、统计分析和量化模型本身。大部分工作在实时交易时段之外的研发中完成。实时交易期间,QT 监控算法表现,在出现异常或意外行为时介入,并随着市场条件变化调整参数。互动对象是代码和数据,而非电话那头的人。
机构交易员
机构交易员的领域是楼上市场——第七部分到第十二部分描述的协商大宗交易的世界。他们的工作是接收来自机构对手方(养老基金、资产管理公司、对冲基金、保险公司)的 RFQ,结合公司量化模型与自身判断为这些交易定价,谈判并执行交易,然后与公司其他部门协调管理由此产生的风险。
IT 的典型一天包括:应对通过第八部分描述的电子平台到达的 RFQ、评估对手方身份和可能的动机(第六部分的逆向选择问题)、决定每笔交易需要多少边际利润、报出一个足够有竞争力以赢得交易但又足够宽以补偿风险的价格,然后与自动化系统合作在执行后对冲头寸。RFQ 之间,IT 可能与对手方交流以维护关系、审查交易台的总风险敞口,或进行内部项目如改进交易台的分析工具。
IT 的工作是量化推理与人类判断的混合体。量化模型提供基础,但最终定价决策取决于模型无法捕捉的因素:对手方是谁?他们知情交易与非知情交易的历史记录如何?这个 RFQ 在当前市场环境下是否不寻常?这笔交易是分散了还是集中了公司现有的账本?竞争的做市商可能有多激进?这些问题需要阅读人心、解读情境,以及在时间压力和信息不完整的情况下做出决策。
IT 的主要工具是公司的定价基础设施(实时波动率曲面、希腊字母计算、对手方分析)、电子 RFQ 平台,以及他们积累的关于谁交易什么和为什么交易的知识。互动对象是人,而不仅仅是代码和数据。
两个角色的交汇点
QT 和 IT 并非彼此独立,而是在同一个生态系统中运作,依赖彼此的工作。
QT 构建的波动率曲面、希腊字母计算和风险模型是 IT 为大宗交易定价时的输入。如果 QT 的模型校准不佳,IT 就从一个不好的理论价格出发,更容易定价失误。如果 QT 的对冲算法效率低下,IT 交易后的风险管理成本就会偏高。IT 依赖 QT 的基础设施,如同外科医生依赖手术器械的质量。
反过来,IT 产生的信息使 QT 的模型变得更好。机构订单流揭示了关于波动率预期、对冲需求和市场持仓的模式——这些对只观察电子订单簿的人不可见。当 IT 交易台看到多只养老基金同时买入下行保护时,这个信号反馈到 QT 的模型校准中,改善公司在所有渠道上的定价。IT 依赖 QT 提供工具,QT 依赖 IT 提供情报。
集中风险账本将他们连接在一起。IT 交易台和 QT 交易台的头寸被汇总到单一的全公司风险视图中。IT 从养老基金承接的看跌期权头寸可能抵消 QT 的算法从电子市场积累的看涨期权头寸。第十部分描述的这种内部净额轧差是公司的核心结构性优势之一,它之所以能运作,正是因为两个交易台向同一个账本输入头寸。
每个角色对人的不同要求
两个角色之间的区别也解释了为什么公司在人选上寻找不同的品质。
QT 角色需要深度的数学推理能力、编程能力和抽象思维能力。最优秀的 QT 能在高等数学理论、极高速计算机系统的工程和模型验证的统计学之间流畅切换。工作在智力上很有深度,但相对独立。QT 的「对手方」是市场本身,而市场不需要温暖、说服力或关系管理。
IT 角色需要一种不同的组合。数学素养很重要 ——IT 必须理解希腊字母、波动率曲面和做市的经济学——但区分性的品质是在不确定性下的判断速度、解读人和情境的能力,以及在维护长期关系的同时有效谈判的技巧。IT 面对的对手方是一个人,通常是一个老练的人,人际互动的质量直接影响公司是否赢得交易以及以什么价格赢得。IT 必须在量化方面足够胜任以理解定价模型,在商业方面足够敏锐以评估竞争态势,在人际方面足够熟练以管理在 60 秒电话中转手数百万美元的关系。
这两个角色都不是「更好」或「更重要」的。它们是同一个商业问题的不同表达——一个面向电子市场,一个面向机构市场——公司的竞争优势来自它们之间的互动。
第十四部分:机构客户交易的常见期权策略
为什么策略素养很重要
下面的期权策略并非奇异的教科书构造。它们是每天到达机构交易台的真实订单,由养老基金、资产管理公司、保险公司和对冲基金提交。理解每种策略的作用以及客户为什么想要它,有助于正确定价——因为策略揭示了客户的意图,而客户的意图揭示了交易的信息含量和风险特征。
领口策略
领口策略(collar)涉及在同一标的资产上同时买入一份虚值看跌期权并卖出一份虚值看涨期权。可以将其视为一笔两部分的交易:看跌期权提供下行保护——如果标的价格跌破看跌期权的行权价,看跌期权产生收益,限制了客户的损失;但这种保护需要花钱(看跌期权权利金)。为了减少或消除这一成本,客户同时以更高的行权价卖出一份看涨期权,收取权利金。作为交换,客户放弃了超过看涨期权行权价的任何收益。两笔权利金部分或完全相互抵消,客户以很低或零净成本获得了下行保护,代价是限制了上行空间。
养老基金和捐赠基金经常对大型股票头寸使用领口策略。领口策略本质上表达的是:「我想防范崩盘,愿意放弃一些上行空间来支付这种保护。」 对于为领口策略定价的做市商来说,两个部分必须同时定价。波动率偏斜(第五部分讨论的)在此直接相关:虚值看跌期权以高于虚值看涨期权的隐含波动率交易,使看跌期权更贵而看涨期权作为融资工具的价值更低。领口策略的净成本在很大程度上取决于偏斜的位置,以及所选行权价上看跌和看涨隐含波动率之间的价差大小。
风险逆转策略
风险逆转(risk reversal)涉及卖出一份虚值看跌期权并买入一份虚值看涨期权(或者反过来)。这是用期权而非标的来表达方向性观点。卖出看跌期权收取的权利金帮助支付看涨期权的费用。如果标的价格涨过看涨期权的行权价,头寸盈利;如果跌破看跌期权的行权价,头寸亏损。
风险逆转还被用作波动率偏斜本身的标准化度量。为理解这一点,回忆第四部分讨论的 delta 可以被解释为期权到期时处于实值状态的近似概率。当交易员提到「25-delta 风险逆转」 时,指的是一份有 25% 概率到期时处于实值状态的看涨期权与一份有 25% 概率到期时处于实值状态的看跌期权之间的隐含波动率差值。(两者都是大致对称地远离当前价格的虚值期权。)这个数字反映的是偏斜的陡峭程度。较大的风险逆转意味着看跌期权比看涨期权贵得多(偏斜陡峭,表明对下行保护的需求旺盛),较小的风险逆转意味着看跌和看涨期权的定价更为对称。
跨式期权和宽跨式期权
跨式期权(straddle)是在同一行权价和到期日同时买入一份看涨期权和一份看跌期权。宽跨式期权(strangle)是在不同的虚值行权价(看涨期权的行权价高于当前价格,看跌期权的行权价低于当前价格)买入一份看涨和一份看跌。两者都是波动率押注——不是对方向的押注,而是对价格变动幅度的押注。如果标的在任一方向上变动足够大,超过了为两份期权支付的合计权利金,就盈利。如果标的保持相对平静,两份期权都因时间衰减而被侵蚀,就亏损。
对冲基金经常在财报发布、央行会议或其他预期将发生大幅价格变动但方向不确定的事件前交易跨式和宽跨式期权。做市商基于隐含波动率水平相对于事件前后预期已实现波动率的关系来定价。如果市场已经计入了大幅的事件驱动变动(隐含波动率很高),跨式期权就很贵,买方需要更大幅度的变动才能盈利。
日历价差
日历价差(calendar spread)是买入一份较长期限的期权并卖出一份较短期限的期权,行权价相同。它交易的是波动率的期限结构(第五部分讨论的)。如果交易员认为短期限波动率相对于长期限被高估了——也许是因为近期事件引发了一个将会消散的暂时性波动率飙升——日历价差就捕捉预期的回归。较短期限的期权因隐含波动率更高而更快地损失价值,如果波动率飙升消退,较长期限的期权则保留更多价值。其差额就是利润。
蝶式期权
蝶式期权(butterfly)是在低行权价买入一份期权、在高行权价买入另一份期权,并在中间行权价卖出两份期权,全部在同一到期日。这创造了一个当标的保持在中间行权价附近时盈利、向任一方向大幅偏移时亏损的头寸。蝶式期权本质上是对标的到期时落点的押注。买方表达的是一个具体观点,不仅关于方向,还关于落点位置。成熟的机构客户用蝶式期权来表达对标的结算价格的精确看法,这比简单地说「我认为它会涨」或「我认为它会跌」是更有针对性的押注。
第十五部分:波动率交易概念
方差风险溢价
方差风险溢价是期权市场最重要的结构性特征之一。它指的是隐含波动率持续倾向于超过随后实际实现的已实现波动率这一现象。
通俗地说,相对于标的最终实际变动的幅度,期权在平均意义上有少许高估。这种高估不是市场的低效或错误,其存在的原因与房屋保险费高于赔付预期成本的原因相同:期权买方(特别是下行保护的买方)愿意支付高于统计公允价格的费用,因为在崩盘期间毫无保护的代价是灾难性的。方差风险溢价就是他们为安心而支付的那部分额外金额。
这一溢价是期权做市——如果操作得当——在长期平均水平上盈利的结构性原因。一个系统性地卖出期权(经过审慎对冲以消除方向性风险)的做市商稳定地收取这一溢价。风险在于任何给定期间内,已实现波动率可能超过隐含波动率,导致亏损。但在长期大量交易中,这一溢价倾向于持续存在,为承担风险的做市商提供正的预期回报。
Gamma 交易
Gamma 交易(gamma scalping)是第四部分描述的 gamma-theta 关系在实践中的体现。如果一个交易员持有买入了期权的头寸(因此具有正 gamma)并频繁做 delta 对冲,他们就通过一个机械性的低买高卖过程从已实现波动率中提取价值。
其运作方式如下。交易员买入期权,获得正 gamma。每次标的价格上涨时,头寸的 delta 变得更正(因为 gamma 的作用),交易员卖出一些标的资产以重新中和 delta。每次标的价格下跌时,头寸的 delta 变得更负,交易员买入一些标的资产。经过标的的许多次小幅振荡,这些重新对冲的交易累积出利润。交易员在系统性地低买高卖——不是因为他们对方向有看法,而是因为 gamma 的力学强制产生了这些盈利性的调整。
Gamma 交易的利润被交易员每天在期权上支付的 theta 所抵消。净结果取决于已实现波动率(驱动 gamma 交易利润)与隐含波动率(决定 theta 成本)之间的关系。如果标的最终变动超过了期权价格的预期,gamma 交易盈利。如果标的变动少于预期,theta 成本超过交易利润,头寸就亏损。
Gamma 交易是波动率交易的最纯粹形式。交易员押注的不是方向,而是标的变动将超过期权市场所定价的幅度。
离散度交易
离散度交易(dispersion trading)是一种更高级的策略,但其核心思想可以理解。
考虑一个像标普 500 这样的股票市场指数,它追踪 500 家公司。指数的价值取决于所有 500 只股票的集体行为。现在考虑两种极端情形。第一种,所有 500 只股票完全同步运动,每天以相同的百分比涨跌。这时指数的波动率与其个股成分完全相同。第二种,500 只股票完全独立运动,有些上涨有些下跌。这时随机的涨跌会部分互相抵消,指数将比任何个股都平静得多。股票之间同步运动的程度被称为相关性(correlation)。
关键洞察在此。为了投资组合保护而购买标普 500 指数期权的投资者,隐含地在为最坏情形——所有股票同时崩盘(高相关性)—— 买单。这意味着指数期权的隐含波动率倾向于高估实际实现的相关性,因为最坏情形是罕见的。大多数时候,有些股票涨有些跌,指数比期权价格所暗示的要平静。
离散度交易通过卖出指数期权(收取膨胀的指数隐含波动率)同时买入个股期权(支付个股的隐含波动率)来利用这一点。当已实现相关性低于所定价的水平时(这是危机时期之外的典型结果),交易盈利。当真正的危机来袭、所有股票同时下跌时,交易亏损。
这一策略之所以相关,是因为像 Optiver 这样的公司在多个交易台上同时交易指数和个股期权,而指数与其成分之间的相关性结构是必须监控和管理的关键风险因素。
第十六部分:ETF 做市
ETF 如何运作
交易所交易基金(Exchange-Traded Fund, ETF)是一种持有一篮子标的资产(股票、债券、大宗商品)并像单只股票一样在交易所上交易的金融产品。购买一份标普 500 ETF 的份额,买入的是一篮子持有指数中所有 500 只股票的按比例权益。ETF 的吸引力在于它提供即时、低成本的分散化——不需要购买 500 只个股(这需要 500 笔单独交易和大量资本),只需买入一种追踪整个指数的产品。
维持 ETF 市场价格与其标的资产价值一致的机制被称为创建和赎回流程(creation and redemption process),它涉及一种被称为授权参与者 (Authorized Participant, AP)的特定类型市场参与者——通常是与 ETF 发行商有特殊协议的大型金融公司。
如果 ETF 的市场价格高于其所持标的股票的总价值(即出现「溢价」premium),AP 可以在公开市场购买标的股票篮子,将其交付给 ETF 发行商,换取新创建的 ETF 份额。然后 AP 在交易所出售这些新份额,从溢价中获利,同时将 ETF 价格推回接近公允价值。
如果 ETF 的市场价格低于其标的股票的价值(即出现「折价」discount),AP 做反向操作:在市场上以低价买入 ETF 份额,将其交付给发行商赎回,换取标的股票。以全额价值出售这些标的股票就捕获了折价,同时将 ETF 价格推回上升。
这种创建和赎回机制如同一个自我修正的弹簧,持续将 ETF 的市场价格拉向其标的持仓的公允价值。
ETF 做市如何运作
ETF 做市商报出的价差由几个组成部分构成。标的价差(underlying spread)是同时买卖标的证券篮子的成本(如果需要通过交易标的股票来对冲 ETF 头寸,就要支付它们的买卖价差)。创建和赎回成本包括创建或赎回 ETF 份额所涉及的 AP 费用和结算成本。风险溢价反映做市商的库存风险以及 ETF 与其标的之间的任何时间错配。
国际 ETF 带来一个特殊挑战。如果一家公司在美国交易时段为一只欧洲股票 ETF 做市,标的的欧洲股票已经收盘过夜。做市商必须基于仍在美国交易的相关指标来估算那些已收盘市场股票的公允价值——如期货合约、汇率以及类似的美国上市公司的行为。这种「公允价值估算」问题是 ETF 做市利润边际的重要来源,因为对已收盘市场价值估算更准确的公司可以报出更窄的价差并赢得更多交易流。
主要的做市公司是世界上最大的 ETF 流动性提供者之一,同时在数百甚至数千只 ETF 上做市。ETF 业务与期权业务互补,因为标的资产的敞口存在重叠,可以在公司的集中风险账本中净额轧差。
第十七部分:从银行到自营交易公司的结构性转变
2008 年之前的格局
2008 年金融危机之前,机构期权交易由高盛(Goldman Sachs)、摩根士丹利(Morgan Stanley)、摩根大通(JP Morgan)等大型投资银行的销售与交易部门主导。这些银行作为全方位服务关系的一部分为机构客户提供流动性,将许多服务捆绑在一起:投资研究、协助筹集资本(如管理公司的首次公开募股 Initial Public Offering, IPO—— 即公司首次向公众出售股份)、主经纪业务 (prime brokerage,一套为对冲基金提供的服务,包括借出证券、为交易提供融资、处理交易结算等行政功能)、贷款,以及与交易并行的并购咨询。银行模式之所以可行,是因为银行拥有吸收交易风险的庞大资本池、在为客户服务的同时以自有资金交易的监管许可,以及数十年建立起来的客户关系。
2008 年之后发生了什么变化
2008 年金融危机暴露了允许银行将受纳税人保护的存款业务与激进的自营交易结合在一起的风险。作为回应,美国国会通过了《多德 - 弗兰克法案》(Dodd-Frank Act),其中包含一项被称为沃尔克规则(Volcker Rule)的条款,限制银行为自有利润交易(相对于为客户需求服务的交易)。银行还必须为其交易头寸持有大幅增加的资本储备,并面临全面更严格的风险限制。在银行资产负债表上持有期权风险的成本急剧上升。
银行并未完全退出做市,但变得更加挑剔:在许多产品上报出更宽的价差,从流动性较低的工具上撤退,并将做市活动集中在产生足够收入以抵消更高资本成本的产品和客户上。
自营交易公司的扩张
Optiver、Citadel Securities、Jane Street、SIG 和 Jump Trading 等自营交易公司填补了这一空缺。由于不受同样的银行业法规约束(因为它们不吸收存款或发放贷款),这些公司可以以更低成本持有交易风险,用技术更高效地管理风险,并更具侵略性地定价。它们最初的扩张发生在电子市场,那里技术优势最为突出——更快的系统、更好的算法和更先进的量化模型。
在过去十年中,扩张进入了机构市场。这些公司建立了机构交易台,直接与银行竞争来自世界上最大的资产管理公司、养老基金和保险公司的大宗交易流。数据反映了这一转变:非银行流动性提供者在 2024 年估计获得了 250-270 亿美元的做市收入,较上年增长 22%。一家主要公司在一年内处理了超过 2 万亿美元的直接客户交易。另一家从 2020 年的约 100 个机构期权客户增长到 2023 年的 400 多个。
与此同时,银行的收入增长越来越多地由融资和主经纪业务服务(贷款和交易服务)驱动,而非由交易中赚取的买卖价差驱动。这表明自营交易公司正在核心交易业务中抢占市场份额。
新均衡
这一转变尚未完成,可能永远不会完全尘埃落定。银行仍拥有自营交易公司无法复制的优势:用于仓储长期限和复杂风险的庞大资产负债表、机构客户看重的研究覆盖、创造经常性业务的主经纪业务关系,以及将交易与其他金融服务捆绑的能力(一家公司在选择交易对手时,同时也管理其 IPO 或为其收购提供咨询的银行就有关系优势)。
市场正朝着混合结构发展。银行倾向于主导结构化产品(复杂的定制化工具)、融资和与咨询关联的交易。自营交易公司倾向于主导流量做市(高交易量、相对标准化的交易)、电子执行,以及越来越多的标准化期权和 ETF 中的机构大宗交易。两者之间的边界不是固定的,随着双方投资于各自能力而持续移动。
第十八部分:钱从哪里来
做市的经济学
理解一家期权做市公司如何产生收入,有助于说清这项业务为何能运作以及它为何以特定方式配置资源。
像 Optiver 这样的做市公司是一家自营本金交易公司(principal trading firm),意味着它在每笔交易中以自有资本承担风险,不像经纪商那样向客户收取佣金。公司的收入完全来自交易价格与管理所产生风险的成本之间的差额。交易员参与全公司利润池的分配,而非因个别交易的利润获得归属。这是一个经过深思熟虑的设计选择,鼓励跨交易台合作而非内部竞争。如果机构交易台承接了一个头寸恰好抵消了电子交易台的风险,两个交易台都受益,两个交易台的交易员都分享这一利益。
收入来源分解如下。
大宗交易的买卖价差。这是最直观的来源。公司承接一笔大宗交易时,交易价格与期权的理论公允价值存在差异。这一差异 ——「边际利润」(edge)—— 就是公司在该交易上的总收入。以一个简化的例子说明:假设公司从一只养老基金买入 10,000 份看跌期权合约,公司模型认为理论公允价值对应 23.0 的隐含波动率,但公司以对应 22.5 隐含波动率的价格买入,对公司来说稍微便宜一些。这半个波动率点,应用到 10,000 份合约上,根据具体期权的特性,可能转化为 50 万到 100 万美元的预期利润。并非每笔交易都有这么多边际利润,很多交易规模更小,公司在一些交易上也会亏损。但跨越数千笔交易汇总来看,价差捕获是一个稳定的收入流。
方差风险溢价。如第十五部分所讨论,隐含波动率在长期内倾向于超过已实现波动率。一个系统性地卖出经对冲的期权的做市商大规模地收取这一溢价。机构交易台通过中介来自那些经常性购买期权进行保护的机构(养老基金购买看跌期权、保险公司购买波动率)的大宗交易,是这一溢价的天然收集者。
信息价值。机构交易中的交易流情报,跨数百个对手方汇总和分析,改善了公司在所有业务线上的定价和风险管理。这种价值不会作为直接利润出现在机构交易台的账目上,但它累积到公司的整体交易表现中。一家了解机构投资者整体动向的公司,能比缺乏这些信息的公司更准确地校准波动率模型。
库存净额轧差。当机构交易流在公司账本内抵消了电子交易流时,公司省去了在公开市场上对冲的交易成本。在一年中,跨越数千笔交易,这种内部净额轧差代表着可观的成本节约。公司避免执行的每一笔外部对冲都节省了佣金、市场冲击成本和对冲工具的买卖价差。
第十九部分:自营交易公司的交易与银行交易有何不同
结构性比较
许多熟悉期权交易概念的人是通过银行「销售与交易」部门的视角来了解它的,这是机构期权交易的传统组织方式。自营交易公司的模式在几个重要方面有着结构性差异。
角色整合。在银行,销售与交易职能通常分为三个独立角色。销售人员(salesperson)维护客户关系并发掘业务(寻找想要交易的客户)。销售交易员(sales trader)处理执行,将客户的需求翻译成具体的市场订单。交易流交易员(flow trader)管理银行账本上由此产生的风险,在交易之后对冲和调整头寸。这些角色各自分离,每个人的职责范围相对狭窄。
在自营交易公司,机构交易员融合了银行三个角色的要素。同一个人管理对手方关系、执行交易,并深度参与风险管理。这种整合意味着交易员的职责范围更广,必须具备比银行中任何单一角色更宽泛的技能组合。
激励结构。在银行,薪酬通常与归属于个人客户覆盖的收入挂钩。一个带来高收入客户的销售人员赚得更多。这产生了以最大化与那些客户交易量为目标的激励,即使有些交易利润微薄甚至亏损——因为销售人员是因收入而非银行在考虑承担的风险后实际保留多少利润而获得奖励的。
在自营交易公司,薪酬来自全公司利润池。不存在银行意义上的「你的」客户。定价决策锚定于公司的量化模型而非个人交易员的自主判断。激励结构不鼓励为量而量的交易,奖励的是定价纪律。以不好的价格赢得一笔交易会损害公司的 P&L,而这直接损害交易员的薪酬。
技术整合。在银行,交易流交易员可能有一个定价工具和一个风险管理系统,但执行和对冲在很大程度上是手动或半自动的。交易员输入订单,监控执行情况,手动调整头寸。
在自营交易公司,机构交易员在一个完全集成的技术栈中运作。量化定价模型、自动对冲算法和风险汇总系统全部实时连接。交易员确认一笔大宗交易后,delta 对冲自动开始执行。交易员的角色是这个系统之上的人类叠加层,做出需要情境、关系和态势感知的判断——系统处理所有可以自动化的事务。交易员不是复制计算机做的事,而是做计算机做不到的事。
结语
本笔记从最基本的问题(为什么金融市场需要中间人?)出发,一路追溯到自营期权做市公司中人类交易员的具体日常决策。这条弧线是有意设计的。每个概念都建立在前一个之上,因为这正是这项业务真实结构的运作方式。市场中的时间错配问题创造了对做市商的需求。期权世界的复杂性和规模创造了对量化模型和人类判断两者的需求。机构订单的规模和敏感性创造了对协商大宗交易的需求。逆向选择、库存风险和对冲成本的经济学决定了为整个运营提供资金的买卖价差。而从银行主导到技术驱动的做市转型,解释了为什么世界上一些最先进的技术公司会雇用人类交易员——他们的工作就是拿起电话与人交谈。
贯穿本文的量化交易员与机构交易员之间的区别,现在应当感觉是这一结构的自然结果。电子市场需要一种智力(数学的、计算的、系统的),机构市场需要另一种智力(情境的、人际的、时间压力下的判断)。公司两者都需要,两者都无法替代对方,因为它们解决的问题在结构上就是不同的,即便它们服务于同一项业务。