HTTP业务速率提升优化指导书V1.1
《HTTP业务速率提升优化指导书V1.1》由西安网友“老白”于2024年08月07日分享,文档编号为5613016,全文共计62页,更多相关《HTTP业务速率提升优化指导书V1.1(DOCX珍藏版)》请在万可派上搜索。
1、HTTP业务速率提升优化指导书版本更新说明产品版本资料版本资料编号资料更新说明R1.0手册第一次发行R1.1增加第四章节流程图、修改地名、修改指导书作者资料版本日期作者审核者R1.02016.6.24王鑫10159087R1.12016.7.14王鑫10159087目录HTTP业务速率提升优化指导书11概述62 业务下载速率关键指标定义(集团)62.1 HTTP浏览业务62.1.1页面显示时长62.1.2页面平均下载速率72.2 视频业务平均下载速率82.3 即时通信业务平均下载速率83 HTTP业务简介83.1 HTTP浏览业务流程图83.2 DNS解析过程103.3 TCP建链过程103.
2、4 请求及响应133.4.1请求133.4.2响应143.5 四次挥手144 业务下载速率提升之无线优化174.1 业务下载速率与弱覆盖关联分析194.1.1 不同区域横向对比分析194.1.2低速率小区与弱覆盖小区关联分析204.1.3解决方案214.2 业务下载速率与SNIR关联分析214.2.1 不同区域横向对比分析214.2.2 低速率小区与低SINR_UL小区关联分析224.2.3 解决方案234.3 业务下载速率与干扰关联分析244.3.1 不同区域横向对比分析244.3.2 低速率小区与干扰小区关联分析254.3.3 解决方案264.4 业务下载速率与容量关联分析264.4.1
3、不同区域横向对比分析274.4.2 低速率小区与高流量小区关联分析284.4.3解决方案284.5 零流量小区排查295 业务下载速率提升之大数据平台定界分析295.1 DO平台简介305.2 对比分析325.2.1 同期对比335.2.2 友商对比345.2.3 同级对比345.3 分解分析355.3.1 指标分解355.3.2 关联指标分析365.3.3小区流量分析:365.3.4 无线时延分析:375.3.5 丢包率分析385.4 下钻分析395.4.1 SP定界395.4.2 核心网定界415.4.3无线定界425.4.4 终端定界435.5 单用户定界定位分析456 无线性能算法优化
4、476.1 TCP ACK分裂476.2 TCP 乱序重排486.3 DNS代理486.4 HTTP优化496.4.1 原理解释496.4.2 业务下载速率验证结果506.4.3 TCP无线时延验证结果526.4.4 关键KPI指标影响527 基于DO平台端到端分析案例547.1 端到端案例之服务器差异分析547.1.1 案例背景547.1.2 MR数据对比分析(RSRP&SINR)557.1.3 用户行为对比分析567.1.4 短板业务挖掘分析577.1.5 分析结论587.2 端到端案例之核心网差异分析587.2.1 案例背景587.2.2 核心网差异分析597.2.3 MR数据差异分析6
5、17.2.4 分析结论621概述移动互联网时代,单独的KPI指标好并不代表用户感知好,需要开始借助大数据平台,从终端、无线、网络及业务平台等进行端到端的优化:2015年中移集团着手推动各省公司进行端到端优化考核,主要通过大数据平台(中兴VMAX、华为SEQ、诺西DO)获取Gn口的速率,从目前的考核分析,Gn口下载速率的业务主要是针对使用HTTP协议的相关业务,因此最终考核汇聚为业务下载速率和TCP无线侧时延方面进行考核。HTTP业务涉及网元较多,任何一个环节均有可能影响到最终的业务下载速率,因此可以借助大数据平台通过各个维度进行对比排查分析。2 业务下载速率关键指标定义(集团)2.1 HTTP
6、浏览业务HTTP业务中,单请求指针对HTTP单个GET请求计算的指标;页面指从用户体验的角度来衡量的完整页面,即若页面涉及多个HTTP GET请求,需要先对页面的多个请求进行关联合成,再计算页面的指标。2.1.1页面显示时长a) 业务需求:评估页面完整打开的平均时间b) 指标定义:合成页面中,90%请求完成数据传输的时间c) 指标算法:(合成页面中最晚结束get的结束时间-合成页面中首get的开始时间)/合成页面个数1) 合成页面中首get的开始时间:指首次GET的TCP建链开始时间2) 合成页面中最晚结束get的结束时间:指在合成页面关联的所有get请求中,实际完成数据传输时间最晚的get请
7、求的结束时间。即,最后一个get的最后一个数据包的ack的时间;如果没有ack,选数据包的时间,如果没有数据包,选择最后一个get的时间。注意,不一定为末get的最后一个内容包,按照实际内容包传输完成的时间在所有get中比对来定。2.1.2页面平均下载速率a) 业务需求:评估用户页面浏览平均下载速率。b) 指标定义:统计时间段内累加页面浏览下载数据量和下载传输时间,总下载数据量除以总下载传输时间为平均下载速率,同单请求下载平均速率。c) 指标算法:(页面下载数据量8)/(页面下载传输时间1000)其中:1、页面下载数据量,如图统计点到间所有HTTP Reply DATA数据量之和。2、页面下载
8、传输时间,如图统计点到间时长。2.2 视频业务平均下载速率视频业务指以HTTP协议承载的视频业务,指标均所有视频的具体单个应用指标平均得来。同时也体现具体业务的指标。 a) 业务需求:评估视频业务的平均下载速率。b) 指标定义:统计时间段内累加流媒体下载数据量和传输时间,总下载数据量除以总传输时间为平均下载速率。c) 指标算法:(视频下载数据量8)/(视频传输时间1000)/N2.3 即时通信业务平均下载速率即时通信业务指以HTTP协议承载的即时通信业务,指标针对所有的具体单个应用指标平均得来。同时也体现具体业务的指标。a) 业务需求:评估即时通信业务消息的速率b) 指标定义:用户成功发送、接
9、收各类消息的速率c) 指标算法:(音频/视频/图片消息的数据量/数据传输时间)/N3 HTTP业务简介3.1 HTTP浏览业务流程图针对一个页面来说,从首TCP建链请求开始到收到最后一个下载数据包的确认ack包时长称之为页面显示时长。一个页面可能有多个Get/Post操作,若该页面存在多个TCP流,则以最后一个TCP流的结束时间为页面最终时间。下图以其中一个流为例进行简述。AB:DNS解析过程;CD:三次握手建立TCP流过程,SYN为第一次握手,SYN ACK为第二次握手过程,ACK为第三次握手过程。第一次握手至第二次握手之间的时延为TCP核心网时延,第二次握手至第三次握手之间的时延为TCP无
10、线时延;EF: 首字节获取过程,首字节获取时间是指从客户端发GET/POST 请求后到服务器相应200 OK,通过记录客户端请求发起时间和收到服务器返回的第一个数据报文的时间两者之差为首字节获取时间;FG:整个页面下载:【页面下载速率(Page Download Throughput)】 = 页面内容大小(Pages Size)/下行数据传输有效时长(Downlink Data Transmit Duration)。页面内容大小指:所有页面下载内容的数据包之和;下行数据有效传输时长指:收到测试页(对象)的首字节到测试页(对象)所有字节传输完毕的时间段。3.2 DNS解析过程域名系统DNS(Do
11、main Name System)是因特网使用的命名系统,用来把便于人们使用的机器名字转换成为IP地址。域名系统其实就是名字系统。我们都知道,IP地址是由32位的二进制数字组成的。用户与因特网上某台主机通信时,显然不愿意使用很难记忆的长达32位的二进制主机地址。即使是点分十进制IP地址也并不太容易记忆。相反,大家愿意使用比较容易记忆的主机名字。3.3 TCP建链过程TCP建立连接时,会有三次握手过程,如下图所示,wireshark截获到了三次握手的三个数据包。第四个包为HTTP协议,说明HTTP业务是基于TCP建立连。三次握手过程: 第一次握手:客户端向服务器发送连接请求包,标志位SYN(同步
12、序号)置为1,序号为X=0 第二次握手:服务器收到客户端发过来报文,由SYN=1知道客户端要求建立联机。向客户端发送一个SYN和ACK都置为1的TCP报文,设置初始序号Y=0,将确认序号(Acknowledgement Number)设置为客户的序列号加1,即X+1 = 0+1=1, 如下图: 第三次握手:客户端收到服务器发来的包后检查确认序号(Acknowledgement Number)是否正确,即第一次发送的序号加1(X+1=1)。以及标志位ACK是否为1。若正确,服务器再次发送确认包,ACK标志位为1,SYN标志位为0。确认序号(Acknowledgement Number)=Y+1=
13、0+1=1,发送序号为X+1=1。客户端收到后确认序号值与ACK=1则连接建立成功,可以传送数据了。 3.4 请求及响应3.4.1请求HTTP请求的方法主要有OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE等。其中最常用的是POST和GET方法。两者的主要区别如下:GET:当客户端想从服务器中读取文档时,使用GET方法。GET方法要求服务器将URL定位的资源放在响应报文的数据部分,回送给客户端。使用GET方法时,请求参数和对应的值附加在URL后面,利用一个(”?”)代表URL的结尾和请求参数的开始,传递参数的长度受限制,如:POST:POST一般用于客户端给服务器提
14、供的信息较多的场景,POST方法将请求参数封装在HTTP请求数据中,以名称/值的形式出现,可以传输大量数据。3.4.2响应当服务器收到请求的报文后,会回复一个响应报文,常见的响应码为 1xx:一般是告诉客户端请求已经收到,正在处理中; 2xx:处理成功,请求已经处理完成;3xx:重定向到其他地方。他让客户端再发送一个请求以完成整个处理;4xx:客户端禁止访问,一般是客户端在请求一个不存在的资源,或者是客户端未被授权;5xx:服务器端处理错误,如HTTP版本不支持,服务器端抛出异常等;3.5 四次挥手TCP断开连接时,会有四次挥手过程,由于TCP连接时全双工的,因此,每个方向都必须要单独进行关闭
15、,这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的连接,收到一个FIN只是意味着这一方向上没有新的数据发送,即不会再收到数据了;但是在这个TCP连接上另一方仍然能够发送数据,直到这一方向也发送了FIN。如下图所示,wireshark截获到了四次挥手的四个数据包。 四次挥手过程: 第一次挥手:客户端给服务器发送TCP包,用来关闭客户端到服务器的数据传送。将标志位FIN和ACK置为1,序号为X=1,确认序号为Z=1。 第二次挥手:服务器收到FIN后,发回一个ACK(标志位ACK=1),确认序号为收到的序号加1,即X=X+1=2。序号为收到的确认序号=Z。 第三次挥手:服务器关闭与
16、客户端的连接,发送一个FIN。标志位FIN和ACK置为1,序号为Y=1,确认序号为X=2。 第四次挥手:客户端收到服务器发送的FIN之后,发回ACK确认(标志位ACK=1),确认序号为收到的序号加1,即Y+1=2。序号为收到的确认序号X=2。 4 业务下载速率提升之无线优化4.1 业务下载速率与弱覆盖关联分析4.1.1 不同区域横向对比分析以MR-RSRP数据为基准,分别对不同区域进行对比分析,以某市为例:中兴区域RSRP主要分布在-110,-78之间,无论在高端还是低端,中兴区域RSRP整体覆盖领先,弱覆盖并非是业务下载速率及TCP无线时延整体落后的主要原因;RSRP PDF分布图:RSRP
17、 CDF分布图:4.1.2低速率小区与弱覆盖小区关联分析筛选弱覆盖TOP小区,按总采样数大于1500个过滤,全网严重弱覆盖(RSRP-115)占比大于10%共计3878个,各区域弱覆盖小区占比具体见下表:区域总小区数严重弱覆盖小区数(RSRP-115)严重弱覆盖小区占比AA478452711.02%BB266197.14%CC354360817.16%DD73013995.47%EE10531141513.44%FF124824919.95%GG139215411.06%HH34013058.97%II149520213.51% 筛选低速率的TOP小区,TOP小区筛选条件建议:可按照低于全网均
18、值或者低于考核值为界限,且一周内低速率次数出现大于等于3天。筛选结果与全网严重弱覆盖小区进行匹配,二者相匹配的小区即可认为是弱覆盖原因导致低速率。低速率小区个数弱覆盖小区个数低速率&弱覆盖小区个数500038834234.1.3解决方案1)结合MR数据中的天线到达角,初步判段用户主要集中在哪个方位角,进行针对性的RF优化;2)适当提升RS发射功率,提升覆盖;3)若无法通过RF优化和RS功率优化时,建议增加站点或者增加室内分布系统,解决弱覆盖;4)若天线存在阻挡,建议推动整改;4.2 业务下载速率与SNIR关联分析4.2.1 不同区域横向对比分析以MR-上行SINR数据为基准,分别对不同厂家进行
19、对比分析,以XX市为例:中兴区域中SINR在9,17区域明显落后,同频干扰仍需优化! 4.2.2 低速率小区与低SINR_UL小区关联分析筛选我司区域低SINR_UL的TOP小区,按总采样数大于1500个过滤,全网SINR_UL3且MR占比10%的小区共计3878个,各区域低SINR_UL的小区占比情况如下表:区域总小区数SINR_UL3且MR占比10%小区数占比AA220530313.74%BB1122724.11%CC159425916.25%DD380183321.92%EE505985516.90%FF56610919.26%GG6587811.85%HH165327016.33%II
20、5379217.13%JJ1935126.42%KK3339.09%筛选低速率的TOP小区,TOP小区筛选条件建议:可按照低于全网均值或者低于考核值为界限,且一周内低速率次数出现大于等于3天。筛选结果与全网低SINR_UL的小区进行匹配,二者相匹配的小区即可认为是上行SINR低的原因导致低速率。匹配小区数示例:低速率小区个数低SINR_UL小区个数低速率&低SINR小区个数50002880689匹配小区结果示例:时间LTE-Tdd小区区县业务下载速率kbpsSinrUL0采样点低SINR占比SinrUL总采样点平均上行信噪比2016/4/1百花山ZLG-3CC586.7652705387.84
21、%7942-7.4479352016/4/1百花山ZLG-1CC354.00984235280.76%51494-5.9911062016/4/1十号线惠新西街南口站2ZLS-41JJ201.872319869773.75%227905-4.4257782016/4/14号线角门西站隧道ZLME-1RDD552.2217272370.73%3334-4.2270554.2.3 解决方案1)结合MR数据中的天线到达角,初步判段用户主要集中在哪个方位角,进行针对性的RF优化,原则为提升主服务小区的RSRP,降低邻区的RSRP,但不能造成其它区域的弱覆盖;2)适当提升或者降低相关小区的RS发射功率,
22、原则为提升主服务小区的RSRP,降低邻区的RSRP,但不能造成其它区域的弱覆盖;3)若现场为弱覆盖区域,且无法通过RF优化和RS功率优化时,建议增加站点或者增加室内分布系统,解决弱覆盖;4)通过调整异频频点改善;5)PCI检查,避免同频同PCI或者模三干扰;4.3 业务下载速率与干扰关联分析4.3.1 不同区域横向对比分析以MR-ENB接收干扰功率数据为基准,分别对不同厂家进行对比分析,以XX市为例:中兴区域中NI在大于-119后明显落后,干扰方面可能导致速率低于对手!4.3.2 低速率小区与干扰小区关联分析筛选我司区域高干扰的TOP小区,按总采样数大于1500个过滤,全网干扰强度大于-105
23、db的小区共计206个,各区域高干扰的小区占比情况如下表:区域总小区数NI-105小区数小区数占比AA4864190.39%JJ25283.17%BB27031.11%KK6722.99%CC3590240.67%DD7369350.47%EE10656570.53%FF126000.00%GG139650.36%HH3410100.29%II1541432.79%筛选低速率的TOP小区,TOP小区筛选条件建议:可按照低于全网均值或者低于考核值为界限,且一周内低速率次数出现大于等于3天。筛选结果与全网高干扰的小区进行匹配,二者相匹配的小区即可认为是高干扰的原因导致低速率。匹配小区数示例:低速率
24、小区个数高干扰小区个数低速率&高干扰小区个数5000206188匹配小区结果示例:小区省份地市厂商名称业务下载速率大于-105采样点RECEIVEDIPOWER总采样点干扰占比平均ENB接收干扰功率DD大成路9号ZL-3XXDD中兴9.11252073720737100.00%-75.004EE天天假日饭店ZL-12XXEE中兴90.29834125241252100.00%-77.474CC窦店电信交道站ZLG-131XXCC中兴35.29124039340393100.00%-89.938DD杜家坎11号院F频ZL-3XXDD中兴28.668738203820100.00%-90.1394
25、.3.3 解决方案1)通过关闭天线通道并实时观察NI频谱,判断干扰来源是系统内还是系统外;2)系统内干扰,重点排查帧头偏移、子帧配比、频点设置、PCI规划及GSP告警、驻波比告警等;3)系统外干扰,通过扫频定位;4.4 业务下载速率与容量关联分析取DO平台的业务下载速率,与网管小区下行总流量关联分析。通过分析明显看出小区的总流量与业务下载速率成反比关系,即小区总流量越大业务下载速率越低。小区总流量与下载速率关系图:4.4.1 不同区域横向对比分析以XX市CC分公司和II分公司为例分析,II分公司的下载速率低于CC分公司,因此从分公司维度对小区的流量统计分析:1)II分公司单小区5G以上流量占比
26、 达52.21%,远高于CC分公司的12.61%。2)从单小区平均流量分析,II分公司每小区平均流量为910M,CC分公司每小区平均流量为781M3)随着小区的流量增加,小区的下载速率呈明显下降趋势。综上,II分公司的下载速率低,与大部分小区的高流量相关,具体数据见下表。IICC小区流量区间对比详表:流量区段0-500M500M-1G1G-5G5G-10G10G以上CC-小区数2029576734347II-小区数9411421833524CC-小区占比60.03%17.04%21.72%1.01%0.21%II-小区占比71.02%10.72%13.81%2.64%1.81%CC-流量占比1
27、2.73%15.90%58.76%9.33%3.28%II-流量占比8.79%8.43%30.57%20.52%31.69%CC-下载速率43784520440039933529II-下载速率45454513409236433359从PDF曲线可以看出II分公司15%的小区承载了80%的流量,而CC分公司30%的小区承载了80%的流量,II高流量小区占比很大。注:横轴是小区百分比,纵轴是流量的CDF曲线。4.4.2 低速率小区与高流量小区关联分析通过对低下载速率与高流量的TOP小区关联分析,关联小区即为高流量导致低速率的小区,关联结果如下示例表。关联结果示例表:站名分公司小区制式日均流量(G)
28、下载速率_kbpsII县政府综合楼ZLII分公司3TD-LTE15.892089.48CC供销技校ZLCC分公司4TD-LTE12.342367.039CC长阳长景新园高四ZLCC分公司2TD-LTE11.092543.277CC葫芦垡西北ZLCC分公司3TD-LTE8.892615.651CC黄辛庄东里12号楼ZLCC分公司2TD-LTE10.672844.206CC窑上ZLCC分公司1TD-LTE8.752925.9464.4.3解决方案1)RF优化,尽量让邻区分担高负荷小区的流量;2)参数调整,通过RS功率、切换门限及邻区对的个体偏移等参数,进行流量和用户的分流;3)算法调整,通过负荷均衡功能,进行流量和用户的分