//
// Generated by NVIDIA NVVM Compiler
// Compiler built on Fri Jul 25 04:36:16 2014 (1406288176)
// Cuda compilation tools, release 6.5, V6.5.13
//

.version 4.1
.target sm_30
.address_size 64

.const .align 8 .b8 polyPoints[204];

.visible .func _Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<101>;
	.reg .s16 	%rs<4>;
	.reg .s32 	%r<49>;
	.reg .f32 	%f<218>;
	.reg .s64 	%rd<13>;


	ld.param.u64 	%rd11, [_Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd10, [_Z13FillSegment32ILi16E7ushort4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd10, 4;
	ld.f32 	%f83, [%rd10+4];
	setp.le.ftz.f32	%p1, %f83, %f2;
	ld.f32 	%f3, [%rd10+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB0_2;
	bra.uni 	BB0_1;

BB0_1:
	mov.f32 	%f201, 0fBF800000;
	bra.uni 	BB0_3;

BB0_2:
	ld.f32 	%f84, [%rd1+-4];
	ld.f32 	%f85, [%rd1+4];
	ld.f32 	%f86, [%rd1];
	sub.ftz.f32 	%f87, %f2, %f86;
	mul.ftz.f32 	%f88, %f85, %f87;
	sub.ftz.f32 	%f89, %f1, %f84;
	sub.ftz.f32 	%f201, %f88, %f89;

BB0_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB0_5;
	bra.uni 	BB0_4;

BB0_4:
	mov.f32 	%f202, 0fBF800000;
	bra.uni 	BB0_6;

BB0_5:
	ld.f32 	%f91, [%rd1+8];
	ld.f32 	%f92, [%rd1+16];
	ld.f32 	%f93, [%rd1+12];
	sub.ftz.f32 	%f94, %f2, %f93;
	mul.ftz.f32 	%f95, %f92, %f94;
	sub.ftz.f32 	%f96, %f1, %f91;
	sub.ftz.f32 	%f202, %f95, %f96;

BB0_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB0_8;
	bra.uni 	BB0_7;

BB0_7:
	mov.f32 	%f203, 0fBF800000;
	bra.uni 	BB0_9;

BB0_8:
	ld.f32 	%f98, [%rd1+20];
	ld.f32 	%f99, [%rd1+28];
	ld.f32 	%f100, [%rd1+24];
	sub.ftz.f32 	%f101, %f2, %f100;
	mul.ftz.f32 	%f102, %f99, %f101;
	sub.ftz.f32 	%f103, %f1, %f98;
	sub.ftz.f32 	%f203, %f102, %f103;

BB0_9:
	ld.f32 	%f12, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f12, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB0_11;
	bra.uni 	BB0_10;

BB0_10:
	mov.f32 	%f204, 0fBF800000;
	bra.uni 	BB0_12;

BB0_11:
	ld.f32 	%f105, [%rd1+32];
	ld.f32 	%f106, [%rd1+40];
	ld.f32 	%f107, [%rd1+36];
	sub.ftz.f32 	%f108, %f2, %f107;
	mul.ftz.f32 	%f109, %f106, %f108;
	sub.ftz.f32 	%f110, %f1, %f105;
	sub.ftz.f32 	%f204, %f109, %f110;

BB0_12:
	ld.f32 	%f15, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f15, %f2;
	setp.le.ftz.f32	%p14, %f12, %f2;
	xor.pred  	%p15, %p14, %p13;
	@!%p15 bra 	BB0_14;
	bra.uni 	BB0_13;

BB0_13:
	mov.f32 	%f205, 0fBF800000;
	bra.uni 	BB0_15;

BB0_14:
	ld.f32 	%f112, [%rd1+44];
	ld.f32 	%f113, [%rd1+52];
	ld.f32 	%f114, [%rd1+48];
	sub.ftz.f32 	%f115, %f2, %f114;
	mul.ftz.f32 	%f116, %f113, %f115;
	sub.ftz.f32 	%f117, %f1, %f112;
	sub.ftz.f32 	%f205, %f116, %f117;

BB0_15:
	ld.f32 	%f18, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f18, %f2;
	setp.le.ftz.f32	%p17, %f15, %f2;
	xor.pred  	%p18, %p17, %p16;
	@!%p18 bra 	BB0_17;
	bra.uni 	BB0_16;

BB0_16:
	mov.f32 	%f206, 0fBF800000;
	bra.uni 	BB0_18;

BB0_17:
	ld.f32 	%f119, [%rd1+56];
	ld.f32 	%f120, [%rd1+64];
	ld.f32 	%f121, [%rd1+60];
	sub.ftz.f32 	%f122, %f2, %f121;
	mul.ftz.f32 	%f123, %f120, %f122;
	sub.ftz.f32 	%f124, %f1, %f119;
	sub.ftz.f32 	%f206, %f123, %f124;

BB0_18:
	ld.f32 	%f21, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f21, %f2;
	setp.le.ftz.f32	%p20, %f18, %f2;
	xor.pred  	%p21, %p20, %p19;
	@!%p21 bra 	BB0_20;
	bra.uni 	BB0_19;

BB0_19:
	mov.f32 	%f207, 0fBF800000;
	bra.uni 	BB0_21;

BB0_20:
	ld.f32 	%f126, [%rd1+68];
	ld.f32 	%f127, [%rd1+76];
	ld.f32 	%f128, [%rd1+72];
	sub.ftz.f32 	%f129, %f2, %f128;
	mul.ftz.f32 	%f130, %f127, %f129;
	sub.ftz.f32 	%f131, %f1, %f126;
	sub.ftz.f32 	%f207, %f130, %f131;

BB0_21:
	ld.f32 	%f24, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f24, %f2;
	setp.le.ftz.f32	%p23, %f21, %f2;
	xor.pred  	%p24, %p23, %p22;
	@!%p24 bra 	BB0_23;
	bra.uni 	BB0_22;

BB0_22:
	mov.f32 	%f208, 0fBF800000;
	bra.uni 	BB0_24;

BB0_23:
	ld.f32 	%f133, [%rd1+80];
	ld.f32 	%f134, [%rd1+88];
	ld.f32 	%f135, [%rd1+84];
	sub.ftz.f32 	%f136, %f2, %f135;
	mul.ftz.f32 	%f137, %f134, %f136;
	sub.ftz.f32 	%f138, %f1, %f133;
	sub.ftz.f32 	%f208, %f137, %f138;

BB0_24:
	ld.f32 	%f27, [%rd1+108];
	setp.gt.ftz.f32	%p25, %f27, %f2;
	setp.le.ftz.f32	%p26, %f24, %f2;
	xor.pred  	%p27, %p26, %p25;
	@!%p27 bra 	BB0_26;
	bra.uni 	BB0_25;

BB0_25:
	mov.f32 	%f209, 0fBF800000;
	bra.uni 	BB0_27;

BB0_26:
	ld.f32 	%f140, [%rd1+92];
	ld.f32 	%f141, [%rd1+100];
	ld.f32 	%f142, [%rd1+96];
	sub.ftz.f32 	%f143, %f2, %f142;
	mul.ftz.f32 	%f144, %f141, %f143;
	sub.ftz.f32 	%f145, %f1, %f140;
	sub.ftz.f32 	%f209, %f144, %f145;

BB0_27:
	ld.f32 	%f30, [%rd1+120];
	setp.gt.ftz.f32	%p28, %f30, %f2;
	setp.le.ftz.f32	%p29, %f27, %f2;
	xor.pred  	%p30, %p29, %p28;
	@!%p30 bra 	BB0_29;
	bra.uni 	BB0_28;

BB0_28:
	mov.f32 	%f210, 0fBF800000;
	bra.uni 	BB0_30;

BB0_29:
	ld.f32 	%f147, [%rd1+104];
	ld.f32 	%f148, [%rd1+112];
	ld.f32 	%f149, [%rd1+108];
	sub.ftz.f32 	%f150, %f2, %f149;
	mul.ftz.f32 	%f151, %f148, %f150;
	sub.ftz.f32 	%f152, %f1, %f147;
	sub.ftz.f32 	%f210, %f151, %f152;

BB0_30:
	ld.f32 	%f33, [%rd1+132];
	setp.gt.ftz.f32	%p31, %f33, %f2;
	setp.le.ftz.f32	%p32, %f30, %f2;
	xor.pred  	%p33, %p32, %p31;
	@!%p33 bra 	BB0_32;
	bra.uni 	BB0_31;

BB0_31:
	mov.f32 	%f211, 0fBF800000;
	bra.uni 	BB0_33;

BB0_32:
	ld.f32 	%f154, [%rd1+116];
	ld.f32 	%f155, [%rd1+124];
	ld.f32 	%f156, [%rd1+120];
	sub.ftz.f32 	%f157, %f2, %f156;
	mul.ftz.f32 	%f158, %f155, %f157;
	sub.ftz.f32 	%f159, %f1, %f154;
	sub.ftz.f32 	%f211, %f158, %f159;

BB0_33:
	ld.f32 	%f36, [%rd1+144];
	setp.gt.ftz.f32	%p34, %f36, %f2;
	setp.le.ftz.f32	%p35, %f33, %f2;
	xor.pred  	%p36, %p35, %p34;
	@!%p36 bra 	BB0_35;
	bra.uni 	BB0_34;

BB0_34:
	mov.f32 	%f212, 0fBF800000;
	bra.uni 	BB0_36;

BB0_35:
	ld.f32 	%f161, [%rd1+128];
	ld.f32 	%f162, [%rd1+136];
	ld.f32 	%f163, [%rd1+132];
	sub.ftz.f32 	%f164, %f2, %f163;
	mul.ftz.f32 	%f165, %f162, %f164;
	sub.ftz.f32 	%f166, %f1, %f161;
	sub.ftz.f32 	%f212, %f165, %f166;

BB0_36:
	ld.f32 	%f39, [%rd1+156];
	setp.gt.ftz.f32	%p37, %f39, %f2;
	setp.le.ftz.f32	%p38, %f36, %f2;
	xor.pred  	%p39, %p38, %p37;
	@!%p39 bra 	BB0_38;
	bra.uni 	BB0_37;

BB0_37:
	mov.f32 	%f213, 0fBF800000;
	bra.uni 	BB0_39;

BB0_38:
	ld.f32 	%f168, [%rd1+140];
	ld.f32 	%f169, [%rd1+148];
	ld.f32 	%f170, [%rd1+144];
	sub.ftz.f32 	%f171, %f2, %f170;
	mul.ftz.f32 	%f172, %f169, %f171;
	sub.ftz.f32 	%f173, %f1, %f168;
	sub.ftz.f32 	%f213, %f172, %f173;

BB0_39:
	ld.f32 	%f42, [%rd1+168];
	setp.gt.ftz.f32	%p40, %f42, %f2;
	setp.le.ftz.f32	%p41, %f39, %f2;
	xor.pred  	%p42, %p41, %p40;
	@!%p42 bra 	BB0_41;
	bra.uni 	BB0_40;

BB0_40:
	mov.f32 	%f214, 0fBF800000;
	bra.uni 	BB0_42;

BB0_41:
	ld.f32 	%f175, [%rd1+152];
	ld.f32 	%f176, [%rd1+160];
	ld.f32 	%f177, [%rd1+156];
	sub.ftz.f32 	%f178, %f2, %f177;
	mul.ftz.f32 	%f179, %f176, %f178;
	sub.ftz.f32 	%f180, %f1, %f175;
	sub.ftz.f32 	%f214, %f179, %f180;

BB0_42:
	ld.f32 	%f45, [%rd1+180];
	setp.gt.ftz.f32	%p43, %f45, %f2;
	setp.le.ftz.f32	%p44, %f42, %f2;
	xor.pred  	%p45, %p44, %p43;
	@!%p45 bra 	BB0_44;
	bra.uni 	BB0_43;

BB0_43:
	mov.f32 	%f215, 0fBF800000;
	bra.uni 	BB0_45;

BB0_44:
	ld.f32 	%f182, [%rd1+164];
	ld.f32 	%f183, [%rd1+172];
	ld.f32 	%f184, [%rd1+168];
	sub.ftz.f32 	%f185, %f2, %f184;
	mul.ftz.f32 	%f186, %f183, %f185;
	sub.ftz.f32 	%f187, %f1, %f182;
	sub.ftz.f32 	%f215, %f186, %f187;

BB0_45:
	ld.f32 	%f189, [%rd1+192];
	setp.gt.ftz.f32	%p46, %f189, %f2;
	setp.le.ftz.f32	%p47, %f45, %f2;
	xor.pred  	%p48, %p47, %p46;
	@!%p48 bra 	BB0_47;
	bra.uni 	BB0_46;

BB0_46:
	mov.f32 	%f216, 0fBF800000;
	bra.uni 	BB0_48;

BB0_47:
	ld.f32 	%f190, [%rd1+176];
	ld.f32 	%f191, [%rd1+184];
	ld.f32 	%f192, [%rd1+180];
	sub.ftz.f32 	%f193, %f2, %f192;
	mul.ftz.f32 	%f194, %f191, %f193;
	sub.ftz.f32 	%f195, %f1, %f190;
	sub.ftz.f32 	%f216, %f194, %f195;

BB0_48:
	mov.u32 	%r45, 0;

BB0_49:
	mov.u32 	%r1, %r45;
	cvt.rn.f32.s32	%f50, %r1;
	setp.gt.ftz.f32	%p49, %f201, %f50;
	@%p49 bra 	BB0_51;

	mov.u32 	%r46, 0;
	mov.f32 	%f217, 0f47C35000;
	bra.uni 	BB0_52;

BB0_51:
	mov.f32 	%f198, 0f47C35000;
	min.ftz.f32 	%f217, %f198, %f201;
	mov.u32 	%r46, 1;

BB0_52:
	setp.leu.ftz.f32	%p50, %f202, %f50;
	@%p50 bra 	BB0_54;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f202;

BB0_54:
	setp.leu.ftz.f32	%p51, %f203, %f50;
	@%p51 bra 	BB0_56;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f203;

BB0_56:
	setp.leu.ftz.f32	%p52, %f204, %f50;
	@%p52 bra 	BB0_58;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f204;

BB0_58:
	setp.leu.ftz.f32	%p53, %f205, %f50;
	@%p53 bra 	BB0_60;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f205;

BB0_60:
	setp.leu.ftz.f32	%p54, %f206, %f50;
	@%p54 bra 	BB0_62;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f206;

BB0_62:
	setp.leu.ftz.f32	%p55, %f207, %f50;
	@%p55 bra 	BB0_64;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f207;

BB0_64:
	setp.leu.ftz.f32	%p56, %f208, %f50;
	@%p56 bra 	BB0_66;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f208;

BB0_66:
	setp.leu.ftz.f32	%p57, %f209, %f50;
	@%p57 bra 	BB0_68;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f209;

BB0_68:
	setp.leu.ftz.f32	%p58, %f210, %f50;
	@%p58 bra 	BB0_70;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f210;

BB0_70:
	setp.leu.ftz.f32	%p59, %f211, %f50;
	@%p59 bra 	BB0_72;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f211;

BB0_72:
	setp.leu.ftz.f32	%p60, %f212, %f50;
	@%p60 bra 	BB0_74;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f212;

BB0_74:
	setp.leu.ftz.f32	%p61, %f213, %f50;
	@%p61 bra 	BB0_76;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f213;

BB0_76:
	setp.leu.ftz.f32	%p62, %f214, %f50;
	@%p62 bra 	BB0_78;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f214;

BB0_78:
	setp.leu.ftz.f32	%p63, %f215, %f50;
	@%p63 bra 	BB0_80;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f215;

BB0_80:
	setp.leu.ftz.f32	%p64, %f216, %f50;
	@%p64 bra 	BB0_82;

	xor.b32  	%r46, %r46, 1;
	min.ftz.f32 	%f217, %f217, %f216;

BB0_82:
	add.s32 	%r45, %r1, 8;
	cvt.rn.f32.s32	%f199, %r45;
	setp.ltu.ftz.f32	%p65, %f217, %f199;
	add.s64 	%rd3, %rd11, 6;
	@%p65 bra 	BB0_85;

	setp.ne.s32	%p66, %r46, 0;
	@%p66 bra 	BB0_91;

	mov.u16 	%rs1, 0;
	st.u16 	[%rd3], %rs1;
	st.u16 	[%rd3+8], %rs1;
	st.u16 	[%rd3+16], %rs1;
	st.u16 	[%rd3+24], %rs1;
	st.u16 	[%rd3+32], %rs1;
	st.u16 	[%rd3+40], %rs1;
	st.u16 	[%rd3+48], %rs1;
	st.u16 	[%rd3+56], %rs1;
	bra.uni 	BB0_91;

BB0_85:
	setp.eq.s32	%p67, %r46, 0;
	add.s64 	%rd12, %rd11, 14;
	add.s32 	%r47, %r1, 1;
	@%p67 bra 	BB0_86;
	bra.uni 	BB0_87;

BB0_86:
	add.s64 	%rd12, %rd11, 14;
	mov.u16 	%rs2, 0;
	st.u16 	[%rd3], %rs2;
	add.s32 	%r47, %r1, 1;

BB0_87:
	mov.u32 	%r48, 1;

BB0_88:
	cvt.rn.f32.s32	%f200, %r47;
	setp.gt.ftz.f32	%p68, %f201, %f200;
	setp.gt.ftz.f32	%p69, %f202, %f200;
	xor.pred  	%p70, %p69, %p68;
	setp.gt.ftz.f32	%p71, %f203, %f200;
	xor.pred  	%p72, %p71, %p70;
	setp.gt.ftz.f32	%p73, %f204, %f200;
	xor.pred  	%p74, %p73, %p72;
	setp.gt.ftz.f32	%p75, %f205, %f200;
	xor.pred  	%p76, %p75, %p74;
	setp.gt.ftz.f32	%p77, %f206, %f200;
	xor.pred  	%p78, %p77, %p76;
	setp.gt.ftz.f32	%p79, %f207, %f200;
	xor.pred  	%p80, %p79, %p78;
	setp.gt.ftz.f32	%p81, %f208, %f200;
	xor.pred  	%p82, %p81, %p80;
	setp.gt.ftz.f32	%p83, %f209, %f200;
	xor.pred  	%p84, %p83, %p82;
	setp.gt.ftz.f32	%p85, %f210, %f200;
	xor.pred  	%p86, %p85, %p84;
	setp.gt.ftz.f32	%p87, %f211, %f200;
	xor.pred  	%p88, %p87, %p86;
	setp.gt.ftz.f32	%p89, %f212, %f200;
	xor.pred  	%p90, %p89, %p88;
	setp.gt.ftz.f32	%p91, %f213, %f200;
	xor.pred  	%p92, %p91, %p90;
	setp.gt.ftz.f32	%p93, %f214, %f200;
	xor.pred  	%p94, %p93, %p92;
	setp.gt.ftz.f32	%p95, %f215, %f200;
	xor.pred  	%p96, %p95, %p94;
	setp.gt.ftz.f32	%p97, %f216, %f200;
	xor.pred  	%p98, %p97, %p96;
	@%p98 bra 	BB0_90;

	mov.u16 	%rs3, 0;
	st.u16 	[%rd12], %rs3;

BB0_90:
	add.s32 	%r48, %r48, 1;
	add.s64 	%rd12, %rd12, 8;
	add.s32 	%r47, %r47, 1;
	setp.lt.s32	%p99, %r48, 8;
	@%p99 bra 	BB0_88;

BB0_91:
	add.s64 	%rd11, %rd11, 64;
	setp.lt.s32	%p100, %r45, 32;
	@%p100 bra 	BB0_49;

	ret;
}

.visible .func _Z13PointDistanceILi16EEv6float2P6float3Pf(
	.param .align 8 .b8 _Z13PointDistanceILi16EEv6float2P6float3Pf_param_0[8],
	.param .b64 _Z13PointDistanceILi16EEv6float2P6float3Pf_param_1,
	.param .b64 _Z13PointDistanceILi16EEv6float2P6float3Pf_param_2
)
{
	.reg .pred 	%p<49>;
	.reg .f32 	%f<177>;
	.reg .s64 	%rd<4>;


	ld.param.f32 	%f1, [_Z13PointDistanceILi16EEv6float2P6float3Pf_param_0];
	ld.param.f32 	%f2, [_Z13PointDistanceILi16EEv6float2P6float3Pf_param_0+4];
	ld.param.u64 	%rd3, [_Z13PointDistanceILi16EEv6float2P6float3Pf_param_1];
	ld.param.u64 	%rd2, [_Z13PointDistanceILi16EEv6float2P6float3Pf_param_2];
	add.s64 	%rd1, %rd3, 4;
	ld.f32 	%f48, [%rd3+4];
	setp.le.ftz.f32	%p1, %f48, %f2;
	ld.f32 	%f162, [%rd3+16];
	setp.gt.ftz.f32	%p2, %f162, %f2;
	xor.pred  	%p3, %p1, %p2;
	@%p3 bra 	BB1_2;

	ld.f32 	%f49, [%rd1+-4];
	ld.f32 	%f50, [%rd1+4];
	ld.f32 	%f51, [%rd1];
	sub.ftz.f32 	%f52, %f2, %f51;
	mul.ftz.f32 	%f53, %f50, %f52;
	sub.ftz.f32 	%f54, %f1, %f49;
	sub.ftz.f32 	%f55, %f53, %f54;
	st.f32 	[%rd2], %f55;
	ld.f32 	%f162, [%rd1+12];

BB1_2:
	ld.f32 	%f163, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f163, %f2;
	setp.le.ftz.f32	%p5, %f162, %f2;
	xor.pred  	%p6, %p5, %p4;
	@%p6 bra 	BB1_4;

	ld.f32 	%f56, [%rd1+8];
	ld.f32 	%f57, [%rd1+16];
	ld.f32 	%f58, [%rd1+12];
	sub.ftz.f32 	%f59, %f2, %f58;
	mul.ftz.f32 	%f60, %f57, %f59;
	sub.ftz.f32 	%f61, %f1, %f56;
	sub.ftz.f32 	%f62, %f60, %f61;
	st.f32 	[%rd2+4], %f62;
	ld.f32 	%f163, [%rd1+24];

BB1_4:
	ld.f32 	%f164, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f164, %f2;
	setp.le.ftz.f32	%p8, %f163, %f2;
	xor.pred  	%p9, %p8, %p7;
	@%p9 bra 	BB1_6;

	ld.f32 	%f63, [%rd1+20];
	ld.f32 	%f64, [%rd1+28];
	ld.f32 	%f65, [%rd1+24];
	sub.ftz.f32 	%f66, %f2, %f65;
	mul.ftz.f32 	%f67, %f64, %f66;
	sub.ftz.f32 	%f68, %f1, %f63;
	sub.ftz.f32 	%f69, %f67, %f68;
	st.f32 	[%rd2+8], %f69;
	ld.f32 	%f164, [%rd1+36];

BB1_6:
	ld.f32 	%f165, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f165, %f2;
	setp.le.ftz.f32	%p11, %f164, %f2;
	xor.pred  	%p12, %p11, %p10;
	@%p12 bra 	BB1_8;

	ld.f32 	%f70, [%rd1+32];
	ld.f32 	%f71, [%rd1+40];
	ld.f32 	%f72, [%rd1+36];
	sub.ftz.f32 	%f73, %f2, %f72;
	mul.ftz.f32 	%f74, %f71, %f73;
	sub.ftz.f32 	%f75, %f1, %f70;
	sub.ftz.f32 	%f76, %f74, %f75;
	st.f32 	[%rd2+12], %f76;
	ld.f32 	%f165, [%rd1+48];

BB1_8:
	ld.f32 	%f166, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f166, %f2;
	setp.le.ftz.f32	%p14, %f165, %f2;
	xor.pred  	%p15, %p14, %p13;
	@%p15 bra 	BB1_10;

	ld.f32 	%f77, [%rd1+44];
	ld.f32 	%f78, [%rd1+52];
	ld.f32 	%f79, [%rd1+48];
	sub.ftz.f32 	%f80, %f2, %f79;
	mul.ftz.f32 	%f81, %f78, %f80;
	sub.ftz.f32 	%f82, %f1, %f77;
	sub.ftz.f32 	%f83, %f81, %f82;
	st.f32 	[%rd2+16], %f83;
	ld.f32 	%f166, [%rd1+60];

BB1_10:
	ld.f32 	%f167, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f167, %f2;
	setp.le.ftz.f32	%p17, %f166, %f2;
	xor.pred  	%p18, %p17, %p16;
	@%p18 bra 	BB1_12;

	ld.f32 	%f84, [%rd1+56];
	ld.f32 	%f85, [%rd1+64];
	ld.f32 	%f86, [%rd1+60];
	sub.ftz.f32 	%f87, %f2, %f86;
	mul.ftz.f32 	%f88, %f85, %f87;
	sub.ftz.f32 	%f89, %f1, %f84;
	sub.ftz.f32 	%f90, %f88, %f89;
	st.f32 	[%rd2+20], %f90;
	ld.f32 	%f167, [%rd1+72];

BB1_12:
	ld.f32 	%f168, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f168, %f2;
	setp.le.ftz.f32	%p20, %f167, %f2;
	xor.pred  	%p21, %p20, %p19;
	@%p21 bra 	BB1_14;

	ld.f32 	%f91, [%rd1+68];
	ld.f32 	%f92, [%rd1+76];
	ld.f32 	%f93, [%rd1+72];
	sub.ftz.f32 	%f94, %f2, %f93;
	mul.ftz.f32 	%f95, %f92, %f94;
	sub.ftz.f32 	%f96, %f1, %f91;
	sub.ftz.f32 	%f97, %f95, %f96;
	st.f32 	[%rd2+24], %f97;
	ld.f32 	%f168, [%rd1+84];

BB1_14:
	ld.f32 	%f169, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f169, %f2;
	setp.le.ftz.f32	%p23, %f168, %f2;
	xor.pred  	%p24, %p23, %p22;
	@%p24 bra 	BB1_16;

	ld.f32 	%f98, [%rd1+80];
	ld.f32 	%f99, [%rd1+88];
	ld.f32 	%f100, [%rd1+84];
	sub.ftz.f32 	%f101, %f2, %f100;
	mul.ftz.f32 	%f102, %f99, %f101;
	sub.ftz.f32 	%f103, %f1, %f98;
	sub.ftz.f32 	%f104, %f102, %f103;
	st.f32 	[%rd2+28], %f104;
	ld.f32 	%f169, [%rd1+96];

BB1_16:
	ld.f32 	%f170, [%rd1+108];
	setp.gt.ftz.f32	%p25, %f170, %f2;
	setp.le.ftz.f32	%p26, %f169, %f2;
	xor.pred  	%p27, %p26, %p25;
	@%p27 bra 	BB1_18;

	ld.f32 	%f105, [%rd1+92];
	ld.f32 	%f106, [%rd1+100];
	ld.f32 	%f107, [%rd1+96];
	sub.ftz.f32 	%f108, %f2, %f107;
	mul.ftz.f32 	%f109, %f106, %f108;
	sub.ftz.f32 	%f110, %f1, %f105;
	sub.ftz.f32 	%f111, %f109, %f110;
	st.f32 	[%rd2+32], %f111;
	ld.f32 	%f170, [%rd1+108];

BB1_18:
	ld.f32 	%f171, [%rd1+120];
	setp.gt.ftz.f32	%p28, %f171, %f2;
	setp.le.ftz.f32	%p29, %f170, %f2;
	xor.pred  	%p30, %p29, %p28;
	@%p30 bra 	BB1_20;

	ld.f32 	%f112, [%rd1+104];
	ld.f32 	%f113, [%rd1+112];
	ld.f32 	%f114, [%rd1+108];
	sub.ftz.f32 	%f115, %f2, %f114;
	mul.ftz.f32 	%f116, %f113, %f115;
	sub.ftz.f32 	%f117, %f1, %f112;
	sub.ftz.f32 	%f118, %f116, %f117;
	st.f32 	[%rd2+36], %f118;
	ld.f32 	%f171, [%rd1+120];

BB1_20:
	ld.f32 	%f172, [%rd1+132];
	setp.gt.ftz.f32	%p31, %f172, %f2;
	setp.le.ftz.f32	%p32, %f171, %f2;
	xor.pred  	%p33, %p32, %p31;
	@%p33 bra 	BB1_22;

	ld.f32 	%f119, [%rd1+116];
	ld.f32 	%f120, [%rd1+124];
	ld.f32 	%f121, [%rd1+120];
	sub.ftz.f32 	%f122, %f2, %f121;
	mul.ftz.f32 	%f123, %f120, %f122;
	sub.ftz.f32 	%f124, %f1, %f119;
	sub.ftz.f32 	%f125, %f123, %f124;
	st.f32 	[%rd2+40], %f125;
	ld.f32 	%f172, [%rd1+132];

BB1_22:
	ld.f32 	%f173, [%rd1+144];
	setp.gt.ftz.f32	%p34, %f173, %f2;
	setp.le.ftz.f32	%p35, %f172, %f2;
	xor.pred  	%p36, %p35, %p34;
	@%p36 bra 	BB1_24;

	ld.f32 	%f126, [%rd1+128];
	ld.f32 	%f127, [%rd1+136];
	ld.f32 	%f128, [%rd1+132];
	sub.ftz.f32 	%f129, %f2, %f128;
	mul.ftz.f32 	%f130, %f127, %f129;
	sub.ftz.f32 	%f131, %f1, %f126;
	sub.ftz.f32 	%f132, %f130, %f131;
	st.f32 	[%rd2+44], %f132;
	ld.f32 	%f173, [%rd1+144];

BB1_24:
	ld.f32 	%f174, [%rd1+156];
	setp.gt.ftz.f32	%p37, %f174, %f2;
	setp.le.ftz.f32	%p38, %f173, %f2;
	xor.pred  	%p39, %p38, %p37;
	@%p39 bra 	BB1_26;

	ld.f32 	%f133, [%rd1+140];
	ld.f32 	%f134, [%rd1+148];
	ld.f32 	%f135, [%rd1+144];
	sub.ftz.f32 	%f136, %f2, %f135;
	mul.ftz.f32 	%f137, %f134, %f136;
	sub.ftz.f32 	%f138, %f1, %f133;
	sub.ftz.f32 	%f139, %f137, %f138;
	st.f32 	[%rd2+48], %f139;
	ld.f32 	%f174, [%rd1+156];

BB1_26:
	ld.f32 	%f175, [%rd1+168];
	setp.gt.ftz.f32	%p40, %f175, %f2;
	setp.le.ftz.f32	%p41, %f174, %f2;
	xor.pred  	%p42, %p41, %p40;
	@%p42 bra 	BB1_28;

	ld.f32 	%f140, [%rd1+152];
	ld.f32 	%f141, [%rd1+160];
	ld.f32 	%f142, [%rd1+156];
	sub.ftz.f32 	%f143, %f2, %f142;
	mul.ftz.f32 	%f144, %f141, %f143;
	sub.ftz.f32 	%f145, %f1, %f140;
	sub.ftz.f32 	%f146, %f144, %f145;
	st.f32 	[%rd2+52], %f146;
	ld.f32 	%f175, [%rd1+168];

BB1_28:
	ld.f32 	%f176, [%rd1+180];
	setp.gt.ftz.f32	%p43, %f176, %f2;
	setp.le.ftz.f32	%p44, %f175, %f2;
	xor.pred  	%p45, %p44, %p43;
	@%p45 bra 	BB1_30;

	ld.f32 	%f147, [%rd1+164];
	ld.f32 	%f148, [%rd1+172];
	ld.f32 	%f149, [%rd1+168];
	sub.ftz.f32 	%f150, %f2, %f149;
	mul.ftz.f32 	%f151, %f148, %f150;
	sub.ftz.f32 	%f152, %f1, %f147;
	sub.ftz.f32 	%f153, %f151, %f152;
	st.f32 	[%rd2+56], %f153;
	ld.f32 	%f176, [%rd1+180];

BB1_30:
	ld.f32 	%f154, [%rd1+192];
	setp.gt.ftz.f32	%p46, %f154, %f2;
	setp.le.ftz.f32	%p47, %f176, %f2;
	xor.pred  	%p48, %p47, %p46;
	@%p48 bra 	BB1_32;

	ld.f32 	%f155, [%rd1+176];
	ld.f32 	%f156, [%rd1+184];
	ld.f32 	%f157, [%rd1+180];
	sub.ftz.f32 	%f158, %f2, %f157;
	mul.ftz.f32 	%f159, %f156, %f158;
	sub.ftz.f32 	%f160, %f1, %f155;
	sub.ftz.f32 	%f161, %f159, %f160;
	st.f32 	[%rd2+60], %f161;

BB1_32:
	ret;
}

.visible .func _Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<142>;
	.reg .s16 	%rs<10>;
	.reg .s32 	%r<30>;
	.reg .f32 	%f<120>;
	.reg .s64 	%rd<7>;


	ld.param.u64 	%rd6, [_Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd5, [_Z13FillSegment32ILi8E7ushort4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd5, 4;
	ld.f32 	%f43, [%rd5+4];
	setp.le.ftz.f32	%p1, %f43, %f2;
	ld.f32 	%f3, [%rd5+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB2_2;
	bra.uni 	BB2_1;

BB2_1:
	mov.f32 	%f111, 0fBF800000;
	bra.uni 	BB2_3;

BB2_2:
	ld.f32 	%f44, [%rd1+-4];
	ld.f32 	%f45, [%rd1+4];
	ld.f32 	%f46, [%rd1];
	sub.ftz.f32 	%f47, %f2, %f46;
	mul.ftz.f32 	%f48, %f45, %f47;
	sub.ftz.f32 	%f49, %f1, %f44;
	sub.ftz.f32 	%f111, %f48, %f49;

BB2_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB2_5;
	bra.uni 	BB2_4;

BB2_4:
	mov.f32 	%f112, 0fBF800000;
	bra.uni 	BB2_6;

BB2_5:
	ld.f32 	%f51, [%rd1+8];
	ld.f32 	%f52, [%rd1+16];
	ld.f32 	%f53, [%rd1+12];
	sub.ftz.f32 	%f54, %f2, %f53;
	mul.ftz.f32 	%f55, %f52, %f54;
	sub.ftz.f32 	%f56, %f1, %f51;
	sub.ftz.f32 	%f112, %f55, %f56;

BB2_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB2_8;
	bra.uni 	BB2_7;

BB2_7:
	mov.f32 	%f113, 0fBF800000;
	bra.uni 	BB2_9;

BB2_8:
	ld.f32 	%f58, [%rd1+20];
	ld.f32 	%f59, [%rd1+28];
	ld.f32 	%f60, [%rd1+24];
	sub.ftz.f32 	%f61, %f2, %f60;
	mul.ftz.f32 	%f62, %f59, %f61;
	sub.ftz.f32 	%f63, %f1, %f58;
	sub.ftz.f32 	%f113, %f62, %f63;

BB2_9:
	ld.f32 	%f12, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f12, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB2_11;
	bra.uni 	BB2_10;

BB2_10:
	mov.f32 	%f114, 0fBF800000;
	bra.uni 	BB2_12;

BB2_11:
	ld.f32 	%f65, [%rd1+32];
	ld.f32 	%f66, [%rd1+40];
	ld.f32 	%f67, [%rd1+36];
	sub.ftz.f32 	%f68, %f2, %f67;
	mul.ftz.f32 	%f69, %f66, %f68;
	sub.ftz.f32 	%f70, %f1, %f65;
	sub.ftz.f32 	%f114, %f69, %f70;

BB2_12:
	ld.f32 	%f15, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f15, %f2;
	setp.le.ftz.f32	%p14, %f12, %f2;
	xor.pred  	%p15, %p14, %p13;
	@!%p15 bra 	BB2_14;
	bra.uni 	BB2_13;

BB2_13:
	mov.f32 	%f115, 0fBF800000;
	bra.uni 	BB2_15;

BB2_14:
	ld.f32 	%f72, [%rd1+44];
	ld.f32 	%f73, [%rd1+52];
	ld.f32 	%f74, [%rd1+48];
	sub.ftz.f32 	%f75, %f2, %f74;
	mul.ftz.f32 	%f76, %f73, %f75;
	sub.ftz.f32 	%f77, %f1, %f72;
	sub.ftz.f32 	%f115, %f76, %f77;

BB2_15:
	ld.f32 	%f18, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f18, %f2;
	setp.le.ftz.f32	%p17, %f15, %f2;
	xor.pred  	%p18, %p17, %p16;
	@!%p18 bra 	BB2_17;
	bra.uni 	BB2_16;

BB2_16:
	mov.f32 	%f116, 0fBF800000;
	bra.uni 	BB2_18;

BB2_17:
	ld.f32 	%f79, [%rd1+56];
	ld.f32 	%f80, [%rd1+64];
	ld.f32 	%f81, [%rd1+60];
	sub.ftz.f32 	%f82, %f2, %f81;
	mul.ftz.f32 	%f83, %f80, %f82;
	sub.ftz.f32 	%f84, %f1, %f79;
	sub.ftz.f32 	%f116, %f83, %f84;

BB2_18:
	ld.f32 	%f21, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f21, %f2;
	setp.le.ftz.f32	%p20, %f18, %f2;
	xor.pred  	%p21, %p20, %p19;
	@!%p21 bra 	BB2_20;
	bra.uni 	BB2_19;

BB2_19:
	mov.f32 	%f117, 0fBF800000;
	bra.uni 	BB2_21;

BB2_20:
	ld.f32 	%f86, [%rd1+68];
	ld.f32 	%f87, [%rd1+76];
	ld.f32 	%f88, [%rd1+72];
	sub.ftz.f32 	%f89, %f2, %f88;
	mul.ftz.f32 	%f90, %f87, %f89;
	sub.ftz.f32 	%f91, %f1, %f86;
	sub.ftz.f32 	%f117, %f90, %f91;

BB2_21:
	ld.f32 	%f93, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f93, %f2;
	setp.le.ftz.f32	%p23, %f21, %f2;
	xor.pred  	%p24, %p23, %p22;
	@!%p24 bra 	BB2_23;
	bra.uni 	BB2_22;

BB2_22:
	mov.f32 	%f118, 0fBF800000;
	bra.uni 	BB2_24;

BB2_23:
	ld.f32 	%f94, [%rd1+80];
	ld.f32 	%f95, [%rd1+88];
	ld.f32 	%f96, [%rd1+84];
	sub.ftz.f32 	%f97, %f2, %f96;
	mul.ftz.f32 	%f98, %f95, %f97;
	sub.ftz.f32 	%f99, %f1, %f94;
	sub.ftz.f32 	%f118, %f98, %f99;

BB2_24:
	mov.u32 	%r28, 0;

BB2_25:
	mov.u32 	%r1, %r28;
	cvt.rn.f32.s32	%f26, %r1;
	setp.gt.ftz.f32	%p25, %f111, %f26;
	@%p25 bra 	BB2_27;

	mov.u32 	%r29, 0;
	mov.f32 	%f119, 0f47C35000;
	bra.uni 	BB2_28;

BB2_27:
	mov.f32 	%f102, 0f47C35000;
	min.ftz.f32 	%f119, %f102, %f111;
	mov.u32 	%r29, 1;

BB2_28:
	setp.leu.ftz.f32	%p26, %f112, %f26;
	@%p26 bra 	BB2_30;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f112;

BB2_30:
	setp.leu.ftz.f32	%p27, %f113, %f26;
	@%p27 bra 	BB2_32;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f113;

BB2_32:
	setp.leu.ftz.f32	%p28, %f114, %f26;
	@%p28 bra 	BB2_34;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f114;

BB2_34:
	setp.leu.ftz.f32	%p29, %f115, %f26;
	@%p29 bra 	BB2_36;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f115;

BB2_36:
	setp.leu.ftz.f32	%p30, %f116, %f26;
	@%p30 bra 	BB2_38;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f116;

BB2_38:
	setp.leu.ftz.f32	%p31, %f117, %f26;
	@%p31 bra 	BB2_40;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f117;

BB2_40:
	setp.leu.ftz.f32	%p32, %f118, %f26;
	@%p32 bra 	BB2_42;

	xor.b32  	%r29, %r29, 1;
	min.ftz.f32 	%f119, %f119, %f118;

BB2_42:
	add.s32 	%r28, %r1, 8;
	cvt.rn.f32.s32	%f103, %r28;
	setp.ltu.ftz.f32	%p33, %f119, %f103;
	@%p33 bra 	BB2_45;

	setp.ne.s32	%p34, %r29, 0;
	@%p34 bra 	BB2_61;

	mov.u16 	%rs1, 0;
	st.u16 	[%rd6+6], %rs1;
	st.u16 	[%rd6+14], %rs1;
	st.u16 	[%rd6+22], %rs1;
	st.u16 	[%rd6+30], %rs1;
	st.u16 	[%rd6+38], %rs1;
	st.u16 	[%rd6+46], %rs1;
	st.u16 	[%rd6+54], %rs1;
	st.u16 	[%rd6+62], %rs1;
	bra.uni 	BB2_61;

BB2_45:
	setp.ne.s32	%p35, %r29, 0;
	@%p35 bra 	BB2_47;

	mov.u16 	%rs2, 0;
	st.u16 	[%rd6+6], %rs2;

BB2_47:
	add.s32 	%r21, %r1, 1;
	cvt.rn.f32.s32	%f104, %r21;
	setp.gt.ftz.f32	%p36, %f111, %f104;
	setp.gt.ftz.f32	%p37, %f112, %f104;
	xor.pred  	%p38, %p37, %p36;
	setp.gt.ftz.f32	%p39, %f113, %f104;
	xor.pred  	%p40, %p39, %p38;
	setp.gt.ftz.f32	%p41, %f114, %f104;
	xor.pred  	%p42, %p41, %p40;
	setp.gt.ftz.f32	%p43, %f115, %f104;
	xor.pred  	%p44, %p43, %p42;
	setp.gt.ftz.f32	%p45, %f116, %f104;
	xor.pred  	%p46, %p45, %p44;
	setp.gt.ftz.f32	%p47, %f117, %f104;
	xor.pred  	%p48, %p47, %p46;
	setp.gt.ftz.f32	%p49, %f118, %f104;
	xor.pred  	%p50, %p49, %p48;
	@%p50 bra 	BB2_49;

	mov.u16 	%rs3, 0;
	st.u16 	[%rd6+14], %rs3;

BB2_49:
	add.s32 	%r22, %r1, 2;
	cvt.rn.f32.s32	%f105, %r22;
	setp.gt.ftz.f32	%p51, %f111, %f105;
	setp.gt.ftz.f32	%p52, %f112, %f105;
	xor.pred  	%p53, %p52, %p51;
	setp.gt.ftz.f32	%p54, %f113, %f105;
	xor.pred  	%p55, %p54, %p53;
	setp.gt.ftz.f32	%p56, %f114, %f105;
	xor.pred  	%p57, %p56, %p55;
	setp.gt.ftz.f32	%p58, %f115, %f105;
	xor.pred  	%p59, %p58, %p57;
	setp.gt.ftz.f32	%p60, %f116, %f105;
	xor.pred  	%p61, %p60, %p59;
	setp.gt.ftz.f32	%p62, %f117, %f105;
	xor.pred  	%p63, %p62, %p61;
	setp.gt.ftz.f32	%p64, %f118, %f105;
	xor.pred  	%p65, %p64, %p63;
	@%p65 bra 	BB2_51;

	mov.u16 	%rs4, 0;
	st.u16 	[%rd6+22], %rs4;

BB2_51:
	add.s32 	%r23, %r1, 3;
	cvt.rn.f32.s32	%f106, %r23;
	setp.gt.ftz.f32	%p66, %f111, %f106;
	setp.gt.ftz.f32	%p67, %f112, %f106;
	xor.pred  	%p68, %p67, %p66;
	setp.gt.ftz.f32	%p69, %f113, %f106;
	xor.pred  	%p70, %p69, %p68;
	setp.gt.ftz.f32	%p71, %f114, %f106;
	xor.pred  	%p72, %p71, %p70;
	setp.gt.ftz.f32	%p73, %f115, %f106;
	xor.pred  	%p74, %p73, %p72;
	setp.gt.ftz.f32	%p75, %f116, %f106;
	xor.pred  	%p76, %p75, %p74;
	setp.gt.ftz.f32	%p77, %f117, %f106;
	xor.pred  	%p78, %p77, %p76;
	setp.gt.ftz.f32	%p79, %f118, %f106;
	xor.pred  	%p80, %p79, %p78;
	@%p80 bra 	BB2_53;

	mov.u16 	%rs5, 0;
	st.u16 	[%rd6+30], %rs5;

BB2_53:
	add.s32 	%r24, %r1, 4;
	cvt.rn.f32.s32	%f107, %r24;
	setp.gt.ftz.f32	%p81, %f111, %f107;
	setp.gt.ftz.f32	%p82, %f112, %f107;
	xor.pred  	%p83, %p82, %p81;
	setp.gt.ftz.f32	%p84, %f113, %f107;
	xor.pred  	%p85, %p84, %p83;
	setp.gt.ftz.f32	%p86, %f114, %f107;
	xor.pred  	%p87, %p86, %p85;
	setp.gt.ftz.f32	%p88, %f115, %f107;
	xor.pred  	%p89, %p88, %p87;
	setp.gt.ftz.f32	%p90, %f116, %f107;
	xor.pred  	%p91, %p90, %p89;
	setp.gt.ftz.f32	%p92, %f117, %f107;
	xor.pred  	%p93, %p92, %p91;
	setp.gt.ftz.f32	%p94, %f118, %f107;
	xor.pred  	%p95, %p94, %p93;
	@%p95 bra 	BB2_55;

	mov.u16 	%rs6, 0;
	st.u16 	[%rd6+38], %rs6;

BB2_55:
	add.s32 	%r25, %r1, 5;
	cvt.rn.f32.s32	%f108, %r25;
	setp.gt.ftz.f32	%p96, %f111, %f108;
	setp.gt.ftz.f32	%p97, %f112, %f108;
	xor.pred  	%p98, %p97, %p96;
	setp.gt.ftz.f32	%p99, %f113, %f108;
	xor.pred  	%p100, %p99, %p98;
	setp.gt.ftz.f32	%p101, %f114, %f108;
	xor.pred  	%p102, %p101, %p100;
	setp.gt.ftz.f32	%p103, %f115, %f108;
	xor.pred  	%p104, %p103, %p102;
	setp.gt.ftz.f32	%p105, %f116, %f108;
	xor.pred  	%p106, %p105, %p104;
	setp.gt.ftz.f32	%p107, %f117, %f108;
	xor.pred  	%p108, %p107, %p106;
	setp.gt.ftz.f32	%p109, %f118, %f108;
	xor.pred  	%p110, %p109, %p108;
	@%p110 bra 	BB2_57;

	mov.u16 	%rs7, 0;
	st.u16 	[%rd6+46], %rs7;

BB2_57:
	add.s32 	%r26, %r1, 6;
	cvt.rn.f32.s32	%f109, %r26;
	setp.gt.ftz.f32	%p111, %f111, %f109;
	setp.gt.ftz.f32	%p112, %f112, %f109;
	xor.pred  	%p113, %p112, %p111;
	setp.gt.ftz.f32	%p114, %f113, %f109;
	xor.pred  	%p115, %p114, %p113;
	setp.gt.ftz.f32	%p116, %f114, %f109;
	xor.pred  	%p117, %p116, %p115;
	setp.gt.ftz.f32	%p118, %f115, %f109;
	xor.pred  	%p119, %p118, %p117;
	setp.gt.ftz.f32	%p120, %f116, %f109;
	xor.pred  	%p121, %p120, %p119;
	setp.gt.ftz.f32	%p122, %f117, %f109;
	xor.pred  	%p123, %p122, %p121;
	setp.gt.ftz.f32	%p124, %f118, %f109;
	xor.pred  	%p125, %p124, %p123;
	@%p125 bra 	BB2_59;

	mov.u16 	%rs8, 0;
	st.u16 	[%rd6+54], %rs8;

BB2_59:
	add.s32 	%r27, %r1, 7;
	cvt.rn.f32.s32	%f110, %r27;
	setp.gt.ftz.f32	%p126, %f111, %f110;
	setp.gt.ftz.f32	%p127, %f112, %f110;
	xor.pred  	%p128, %p127, %p126;
	setp.gt.ftz.f32	%p129, %f113, %f110;
	xor.pred  	%p130, %p129, %p128;
	setp.gt.ftz.f32	%p131, %f114, %f110;
	xor.pred  	%p132, %p131, %p130;
	setp.gt.ftz.f32	%p133, %f115, %f110;
	xor.pred  	%p134, %p133, %p132;
	setp.gt.ftz.f32	%p135, %f116, %f110;
	xor.pred  	%p136, %p135, %p134;
	setp.gt.ftz.f32	%p137, %f117, %f110;
	xor.pred  	%p138, %p137, %p136;
	setp.gt.ftz.f32	%p139, %f118, %f110;
	xor.pred  	%p140, %p139, %p138;
	@%p140 bra 	BB2_61;

	mov.u16 	%rs9, 0;
	st.u16 	[%rd6+62], %rs9;

BB2_61:
	add.s64 	%rd6, %rd6, 64;
	setp.lt.s32	%p141, %r28, 32;
	@%p141 bra 	BB2_25;

	ret;
}

.visible .func _Z13PointDistanceILi8EEv6float2P6float3Pf(
	.param .align 8 .b8 _Z13PointDistanceILi8EEv6float2P6float3Pf_param_0[8],
	.param .b64 _Z13PointDistanceILi8EEv6float2P6float3Pf_param_1,
	.param .b64 _Z13PointDistanceILi8EEv6float2P6float3Pf_param_2
)
{
	.reg .pred 	%p<25>;
	.reg .f32 	%f<89>;
	.reg .s64 	%rd<4>;


	ld.param.f32 	%f1, [_Z13PointDistanceILi8EEv6float2P6float3Pf_param_0];
	ld.param.f32 	%f2, [_Z13PointDistanceILi8EEv6float2P6float3Pf_param_0+4];
	ld.param.u64 	%rd3, [_Z13PointDistanceILi8EEv6float2P6float3Pf_param_1];
	ld.param.u64 	%rd2, [_Z13PointDistanceILi8EEv6float2P6float3Pf_param_2];
	add.s64 	%rd1, %rd3, 4;
	ld.f32 	%f24, [%rd3+4];
	setp.le.ftz.f32	%p1, %f24, %f2;
	ld.f32 	%f82, [%rd3+16];
	setp.gt.ftz.f32	%p2, %f82, %f2;
	xor.pred  	%p3, %p1, %p2;
	@%p3 bra 	BB3_2;

	ld.f32 	%f25, [%rd1+-4];
	ld.f32 	%f26, [%rd1+4];
	ld.f32 	%f27, [%rd1];
	sub.ftz.f32 	%f28, %f2, %f27;
	mul.ftz.f32 	%f29, %f26, %f28;
	sub.ftz.f32 	%f30, %f1, %f25;
	sub.ftz.f32 	%f31, %f29, %f30;
	st.f32 	[%rd2], %f31;
	ld.f32 	%f82, [%rd1+12];

BB3_2:
	ld.f32 	%f83, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f83, %f2;
	setp.le.ftz.f32	%p5, %f82, %f2;
	xor.pred  	%p6, %p5, %p4;
	@%p6 bra 	BB3_4;

	ld.f32 	%f32, [%rd1+8];
	ld.f32 	%f33, [%rd1+16];
	ld.f32 	%f34, [%rd1+12];
	sub.ftz.f32 	%f35, %f2, %f34;
	mul.ftz.f32 	%f36, %f33, %f35;
	sub.ftz.f32 	%f37, %f1, %f32;
	sub.ftz.f32 	%f38, %f36, %f37;
	st.f32 	[%rd2+4], %f38;
	ld.f32 	%f83, [%rd1+24];

BB3_4:
	ld.f32 	%f84, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f84, %f2;
	setp.le.ftz.f32	%p8, %f83, %f2;
	xor.pred  	%p9, %p8, %p7;
	@%p9 bra 	BB3_6;

	ld.f32 	%f39, [%rd1+20];
	ld.f32 	%f40, [%rd1+28];
	ld.f32 	%f41, [%rd1+24];
	sub.ftz.f32 	%f42, %f2, %f41;
	mul.ftz.f32 	%f43, %f40, %f42;
	sub.ftz.f32 	%f44, %f1, %f39;
	sub.ftz.f32 	%f45, %f43, %f44;
	st.f32 	[%rd2+8], %f45;
	ld.f32 	%f84, [%rd1+36];

BB3_6:
	ld.f32 	%f85, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f85, %f2;
	setp.le.ftz.f32	%p11, %f84, %f2;
	xor.pred  	%p12, %p11, %p10;
	@%p12 bra 	BB3_8;

	ld.f32 	%f46, [%rd1+32];
	ld.f32 	%f47, [%rd1+40];
	ld.f32 	%f48, [%rd1+36];
	sub.ftz.f32 	%f49, %f2, %f48;
	mul.ftz.f32 	%f50, %f47, %f49;
	sub.ftz.f32 	%f51, %f1, %f46;
	sub.ftz.f32 	%f52, %f50, %f51;
	st.f32 	[%rd2+12], %f52;
	ld.f32 	%f85, [%rd1+48];

BB3_8:
	ld.f32 	%f86, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f86, %f2;
	setp.le.ftz.f32	%p14, %f85, %f2;
	xor.pred  	%p15, %p14, %p13;
	@%p15 bra 	BB3_10;

	ld.f32 	%f53, [%rd1+44];
	ld.f32 	%f54, [%rd1+52];
	ld.f32 	%f55, [%rd1+48];
	sub.ftz.f32 	%f56, %f2, %f55;
	mul.ftz.f32 	%f57, %f54, %f56;
	sub.ftz.f32 	%f58, %f1, %f53;
	sub.ftz.f32 	%f59, %f57, %f58;
	st.f32 	[%rd2+16], %f59;
	ld.f32 	%f86, [%rd1+60];

BB3_10:
	ld.f32 	%f87, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f87, %f2;
	setp.le.ftz.f32	%p17, %f86, %f2;
	xor.pred  	%p18, %p17, %p16;
	@%p18 bra 	BB3_12;

	ld.f32 	%f60, [%rd1+56];
	ld.f32 	%f61, [%rd1+64];
	ld.f32 	%f62, [%rd1+60];
	sub.ftz.f32 	%f63, %f2, %f62;
	mul.ftz.f32 	%f64, %f61, %f63;
	sub.ftz.f32 	%f65, %f1, %f60;
	sub.ftz.f32 	%f66, %f64, %f65;
	st.f32 	[%rd2+20], %f66;
	ld.f32 	%f87, [%rd1+72];

BB3_12:
	ld.f32 	%f88, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f88, %f2;
	setp.le.ftz.f32	%p20, %f87, %f2;
	xor.pred  	%p21, %p20, %p19;
	@%p21 bra 	BB3_14;

	ld.f32 	%f67, [%rd1+68];
	ld.f32 	%f68, [%rd1+76];
	ld.f32 	%f69, [%rd1+72];
	sub.ftz.f32 	%f70, %f2, %f69;
	mul.ftz.f32 	%f71, %f68, %f70;
	sub.ftz.f32 	%f72, %f1, %f67;
	sub.ftz.f32 	%f73, %f71, %f72;
	st.f32 	[%rd2+24], %f73;
	ld.f32 	%f88, [%rd1+84];

BB3_14:
	ld.f32 	%f74, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f74, %f2;
	setp.le.ftz.f32	%p23, %f88, %f2;
	xor.pred  	%p24, %p23, %p22;
	@%p24 bra 	BB3_16;

	ld.f32 	%f75, [%rd1+80];
	ld.f32 	%f76, [%rd1+88];
	ld.f32 	%f77, [%rd1+84];
	sub.ftz.f32 	%f78, %f2, %f77;
	mul.ftz.f32 	%f79, %f76, %f78;
	sub.ftz.f32 	%f80, %f1, %f75;
	sub.ftz.f32 	%f81, %f79, %f80;
	st.f32 	[%rd2+28], %f81;

BB3_16:
	ret;
}

.visible .func _Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<70>;
	.reg .s16 	%rs<10>;
	.reg .s32 	%r<22>;
	.reg .f32 	%f<68>;
	.reg .s64 	%rd<7>;


	ld.param.u64 	%rd6, [_Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd5, [_Z13FillSegment32ILi4E7ushort4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd5, 4;
	ld.f32 	%f23, [%rd5+4];
	setp.le.ftz.f32	%p1, %f23, %f2;
	ld.f32 	%f3, [%rd5+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB4_2;
	bra.uni 	BB4_1;

BB4_1:
	mov.f32 	%f63, 0fBF800000;
	bra.uni 	BB4_3;

BB4_2:
	ld.f32 	%f24, [%rd1+-4];
	ld.f32 	%f25, [%rd1+4];
	ld.f32 	%f26, [%rd1];
	sub.ftz.f32 	%f27, %f2, %f26;
	mul.ftz.f32 	%f28, %f25, %f27;
	sub.ftz.f32 	%f29, %f1, %f24;
	sub.ftz.f32 	%f63, %f28, %f29;

BB4_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB4_5;
	bra.uni 	BB4_4;

BB4_4:
	mov.f32 	%f64, 0fBF800000;
	bra.uni 	BB4_6;

BB4_5:
	ld.f32 	%f31, [%rd1+8];
	ld.f32 	%f32, [%rd1+16];
	ld.f32 	%f33, [%rd1+12];
	sub.ftz.f32 	%f34, %f2, %f33;
	mul.ftz.f32 	%f35, %f32, %f34;
	sub.ftz.f32 	%f36, %f1, %f31;
	sub.ftz.f32 	%f64, %f35, %f36;

BB4_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB4_8;
	bra.uni 	BB4_7;

BB4_7:
	mov.f32 	%f65, 0fBF800000;
	bra.uni 	BB4_9;

BB4_8:
	ld.f32 	%f38, [%rd1+20];
	ld.f32 	%f39, [%rd1+28];
	ld.f32 	%f40, [%rd1+24];
	sub.ftz.f32 	%f41, %f2, %f40;
	mul.ftz.f32 	%f42, %f39, %f41;
	sub.ftz.f32 	%f43, %f1, %f38;
	sub.ftz.f32 	%f65, %f42, %f43;

BB4_9:
	ld.f32 	%f45, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f45, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB4_11;
	bra.uni 	BB4_10;

BB4_10:
	mov.f32 	%f66, 0fBF800000;
	bra.uni 	BB4_12;

BB4_11:
	ld.f32 	%f46, [%rd1+32];
	ld.f32 	%f47, [%rd1+40];
	ld.f32 	%f48, [%rd1+36];
	sub.ftz.f32 	%f49, %f2, %f48;
	mul.ftz.f32 	%f50, %f47, %f49;
	sub.ftz.f32 	%f51, %f1, %f46;
	sub.ftz.f32 	%f66, %f50, %f51;

BB4_12:
	mov.u32 	%r20, 0;

BB4_13:
	mov.u32 	%r1, %r20;
	cvt.rn.f32.s32	%f14, %r1;
	setp.gt.ftz.f32	%p13, %f63, %f14;
	@%p13 bra 	BB4_15;

	mov.u32 	%r21, 0;
	mov.f32 	%f67, 0f47C35000;
	bra.uni 	BB4_16;

BB4_15:
	mov.f32 	%f54, 0f47C35000;
	min.ftz.f32 	%f67, %f54, %f63;
	mov.u32 	%r21, 1;

BB4_16:
	setp.leu.ftz.f32	%p14, %f64, %f14;
	@%p14 bra 	BB4_18;

	xor.b32  	%r21, %r21, 1;
	min.ftz.f32 	%f67, %f67, %f64;

BB4_18:
	setp.leu.ftz.f32	%p15, %f65, %f14;
	@%p15 bra 	BB4_20;

	xor.b32  	%r21, %r21, 1;
	min.ftz.f32 	%f67, %f67, %f65;

BB4_20:
	setp.leu.ftz.f32	%p16, %f66, %f14;
	@%p16 bra 	BB4_22;

	xor.b32  	%r21, %r21, 1;
	min.ftz.f32 	%f67, %f67, %f66;

BB4_22:
	add.s32 	%r20, %r1, 8;
	cvt.rn.f32.s32	%f55, %r20;
	setp.ltu.ftz.f32	%p17, %f67, %f55;
	@%p17 bra 	BB4_25;

	setp.ne.s32	%p18, %r21, 0;
	@%p18 bra 	BB4_41;

	mov.u16 	%rs1, 0;
	st.u16 	[%rd6+6], %rs1;
	st.u16 	[%rd6+14], %rs1;
	st.u16 	[%rd6+22], %rs1;
	st.u16 	[%rd6+30], %rs1;
	st.u16 	[%rd6+38], %rs1;
	st.u16 	[%rd6+46], %rs1;
	st.u16 	[%rd6+54], %rs1;
	st.u16 	[%rd6+62], %rs1;
	bra.uni 	BB4_41;

BB4_25:
	setp.ne.s32	%p19, %r21, 0;
	@%p19 bra 	BB4_27;

	mov.u16 	%rs2, 0;
	st.u16 	[%rd6+6], %rs2;

BB4_27:
	add.s32 	%r13, %r1, 1;
	cvt.rn.f32.s32	%f56, %r13;
	setp.gt.ftz.f32	%p20, %f63, %f56;
	setp.gt.ftz.f32	%p21, %f64, %f56;
	xor.pred  	%p22, %p21, %p20;
	setp.gt.ftz.f32	%p23, %f65, %f56;
	xor.pred  	%p24, %p23, %p22;
	setp.gt.ftz.f32	%p25, %f66, %f56;
	xor.pred  	%p26, %p25, %p24;
	@%p26 bra 	BB4_29;

	mov.u16 	%rs3, 0;
	st.u16 	[%rd6+14], %rs3;

BB4_29:
	add.s32 	%r14, %r1, 2;
	cvt.rn.f32.s32	%f57, %r14;
	setp.gt.ftz.f32	%p27, %f63, %f57;
	setp.gt.ftz.f32	%p28, %f64, %f57;
	xor.pred  	%p29, %p28, %p27;
	setp.gt.ftz.f32	%p30, %f65, %f57;
	xor.pred  	%p31, %p30, %p29;
	setp.gt.ftz.f32	%p32, %f66, %f57;
	xor.pred  	%p33, %p32, %p31;
	@%p33 bra 	BB4_31;

	mov.u16 	%rs4, 0;
	st.u16 	[%rd6+22], %rs4;

BB4_31:
	add.s32 	%r15, %r1, 3;
	cvt.rn.f32.s32	%f58, %r15;
	setp.gt.ftz.f32	%p34, %f63, %f58;
	setp.gt.ftz.f32	%p35, %f64, %f58;
	xor.pred  	%p36, %p35, %p34;
	setp.gt.ftz.f32	%p37, %f65, %f58;
	xor.pred  	%p38, %p37, %p36;
	setp.gt.ftz.f32	%p39, %f66, %f58;
	xor.pred  	%p40, %p39, %p38;
	@%p40 bra 	BB4_33;

	mov.u16 	%rs5, 0;
	st.u16 	[%rd6+30], %rs5;

BB4_33:
	add.s32 	%r16, %r1, 4;
	cvt.rn.f32.s32	%f59, %r16;
	setp.gt.ftz.f32	%p41, %f63, %f59;
	setp.gt.ftz.f32	%p42, %f64, %f59;
	xor.pred  	%p43, %p42, %p41;
	setp.gt.ftz.f32	%p44, %f65, %f59;
	xor.pred  	%p45, %p44, %p43;
	setp.gt.ftz.f32	%p46, %f66, %f59;
	xor.pred  	%p47, %p46, %p45;
	@%p47 bra 	BB4_35;

	mov.u16 	%rs6, 0;
	st.u16 	[%rd6+38], %rs6;

BB4_35:
	add.s32 	%r17, %r1, 5;
	cvt.rn.f32.s32	%f60, %r17;
	setp.gt.ftz.f32	%p48, %f63, %f60;
	setp.gt.ftz.f32	%p49, %f64, %f60;
	xor.pred  	%p50, %p49, %p48;
	setp.gt.ftz.f32	%p51, %f65, %f60;
	xor.pred  	%p52, %p51, %p50;
	setp.gt.ftz.f32	%p53, %f66, %f60;
	xor.pred  	%p54, %p53, %p52;
	@%p54 bra 	BB4_37;

	mov.u16 	%rs7, 0;
	st.u16 	[%rd6+46], %rs7;

BB4_37:
	add.s32 	%r18, %r1, 6;
	cvt.rn.f32.s32	%f61, %r18;
	setp.gt.ftz.f32	%p55, %f63, %f61;
	setp.gt.ftz.f32	%p56, %f64, %f61;
	xor.pred  	%p57, %p56, %p55;
	setp.gt.ftz.f32	%p58, %f65, %f61;
	xor.pred  	%p59, %p58, %p57;
	setp.gt.ftz.f32	%p60, %f66, %f61;
	xor.pred  	%p61, %p60, %p59;
	@%p61 bra 	BB4_39;

	mov.u16 	%rs8, 0;
	st.u16 	[%rd6+54], %rs8;

BB4_39:
	add.s32 	%r19, %r1, 7;
	cvt.rn.f32.s32	%f62, %r19;
	setp.gt.ftz.f32	%p62, %f63, %f62;
	setp.gt.ftz.f32	%p63, %f64, %f62;
	xor.pred  	%p64, %p63, %p62;
	setp.gt.ftz.f32	%p65, %f65, %f62;
	xor.pred  	%p66, %p65, %p64;
	setp.gt.ftz.f32	%p67, %f66, %f62;
	xor.pred  	%p68, %p67, %p66;
	@%p68 bra 	BB4_41;

	mov.u16 	%rs9, 0;
	st.u16 	[%rd6+62], %rs9;

BB4_41:
	add.s64 	%rd6, %rd6, 64;
	setp.lt.s32	%p69, %r20, 32;
	@%p69 bra 	BB4_13;

	ret;
}

.visible .func _Z13PointDistanceILi4EEv6float2P6float3Pf(
	.param .align 8 .b8 _Z13PointDistanceILi4EEv6float2P6float3Pf_param_0[8],
	.param .b64 _Z13PointDistanceILi4EEv6float2P6float3Pf_param_1,
	.param .b64 _Z13PointDistanceILi4EEv6float2P6float3Pf_param_2
)
{
	.reg .pred 	%p<13>;
	.reg .f32 	%f<45>;
	.reg .s64 	%rd<4>;


	ld.param.f32 	%f1, [_Z13PointDistanceILi4EEv6float2P6float3Pf_param_0];
	ld.param.f32 	%f2, [_Z13PointDistanceILi4EEv6float2P6float3Pf_param_0+4];
	ld.param.u64 	%rd3, [_Z13PointDistanceILi4EEv6float2P6float3Pf_param_1];
	ld.param.u64 	%rd2, [_Z13PointDistanceILi4EEv6float2P6float3Pf_param_2];
	add.s64 	%rd1, %rd3, 4;
	ld.f32 	%f12, [%rd3+4];
	setp.le.ftz.f32	%p1, %f12, %f2;
	ld.f32 	%f42, [%rd3+16];
	setp.gt.ftz.f32	%p2, %f42, %f2;
	xor.pred  	%p3, %p1, %p2;
	@%p3 bra 	BB5_2;

	ld.f32 	%f13, [%rd1+-4];
	ld.f32 	%f14, [%rd1+4];
	ld.f32 	%f15, [%rd1];
	sub.ftz.f32 	%f16, %f2, %f15;
	mul.ftz.f32 	%f17, %f14, %f16;
	sub.ftz.f32 	%f18, %f1, %f13;
	sub.ftz.f32 	%f19, %f17, %f18;
	st.f32 	[%rd2], %f19;
	ld.f32 	%f42, [%rd1+12];

BB5_2:
	ld.f32 	%f43, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f43, %f2;
	setp.le.ftz.f32	%p5, %f42, %f2;
	xor.pred  	%p6, %p5, %p4;
	@%p6 bra 	BB5_4;

	ld.f32 	%f20, [%rd1+8];
	ld.f32 	%f21, [%rd1+16];
	ld.f32 	%f22, [%rd1+12];
	sub.ftz.f32 	%f23, %f2, %f22;
	mul.ftz.f32 	%f24, %f21, %f23;
	sub.ftz.f32 	%f25, %f1, %f20;
	sub.ftz.f32 	%f26, %f24, %f25;
	st.f32 	[%rd2+4], %f26;
	ld.f32 	%f43, [%rd1+24];

BB5_4:
	ld.f32 	%f44, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f44, %f2;
	setp.le.ftz.f32	%p8, %f43, %f2;
	xor.pred  	%p9, %p8, %p7;
	@%p9 bra 	BB5_6;

	ld.f32 	%f27, [%rd1+20];
	ld.f32 	%f28, [%rd1+28];
	ld.f32 	%f29, [%rd1+24];
	sub.ftz.f32 	%f30, %f2, %f29;
	mul.ftz.f32 	%f31, %f28, %f30;
	sub.ftz.f32 	%f32, %f1, %f27;
	sub.ftz.f32 	%f33, %f31, %f32;
	st.f32 	[%rd2+8], %f33;
	ld.f32 	%f44, [%rd1+36];

BB5_6:
	ld.f32 	%f34, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f34, %f2;
	setp.le.ftz.f32	%p11, %f44, %f2;
	xor.pred  	%p12, %p11, %p10;
	@%p12 bra 	BB5_8;

	ld.f32 	%f35, [%rd1+32];
	ld.f32 	%f36, [%rd1+40];
	ld.f32 	%f37, [%rd1+36];
	sub.ftz.f32 	%f38, %f2, %f37;
	mul.ftz.f32 	%f39, %f36, %f38;
	sub.ftz.f32 	%f40, %f1, %f35;
	sub.ftz.f32 	%f41, %f39, %f40;
	st.f32 	[%rd2+12], %f41;

BB5_8:
	ret;
}

.visible .func _Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<101>;
	.reg .s32 	%r<52>;
	.reg .f32 	%f<218>;
	.reg .s64 	%rd<13>;


	ld.param.u64 	%rd11, [_Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd10, [_Z13FillSegment32ILi16E6float4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd10, 4;
	ld.f32 	%f83, [%rd10+4];
	setp.le.ftz.f32	%p1, %f83, %f2;
	ld.f32 	%f3, [%rd10+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB6_2;
	bra.uni 	BB6_1;

BB6_1:
	mov.f32 	%f201, 0fBF800000;
	bra.uni 	BB6_3;

BB6_2:
	ld.f32 	%f84, [%rd1+-4];
	ld.f32 	%f85, [%rd1+4];
	ld.f32 	%f86, [%rd1];
	sub.ftz.f32 	%f87, %f2, %f86;
	mul.ftz.f32 	%f88, %f85, %f87;
	sub.ftz.f32 	%f89, %f1, %f84;
	sub.ftz.f32 	%f201, %f88, %f89;

BB6_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB6_5;
	bra.uni 	BB6_4;

BB6_4:
	mov.f32 	%f202, 0fBF800000;
	bra.uni 	BB6_6;

BB6_5:
	ld.f32 	%f91, [%rd1+8];
	ld.f32 	%f92, [%rd1+16];
	ld.f32 	%f93, [%rd1+12];
	sub.ftz.f32 	%f94, %f2, %f93;
	mul.ftz.f32 	%f95, %f92, %f94;
	sub.ftz.f32 	%f96, %f1, %f91;
	sub.ftz.f32 	%f202, %f95, %f96;

BB6_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB6_8;
	bra.uni 	BB6_7;

BB6_7:
	mov.f32 	%f203, 0fBF800000;
	bra.uni 	BB6_9;

BB6_8:
	ld.f32 	%f98, [%rd1+20];
	ld.f32 	%f99, [%rd1+28];
	ld.f32 	%f100, [%rd1+24];
	sub.ftz.f32 	%f101, %f2, %f100;
	mul.ftz.f32 	%f102, %f99, %f101;
	sub.ftz.f32 	%f103, %f1, %f98;
	sub.ftz.f32 	%f203, %f102, %f103;

BB6_9:
	ld.f32 	%f12, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f12, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB6_11;
	bra.uni 	BB6_10;

BB6_10:
	mov.f32 	%f204, 0fBF800000;
	bra.uni 	BB6_12;

BB6_11:
	ld.f32 	%f105, [%rd1+32];
	ld.f32 	%f106, [%rd1+40];
	ld.f32 	%f107, [%rd1+36];
	sub.ftz.f32 	%f108, %f2, %f107;
	mul.ftz.f32 	%f109, %f106, %f108;
	sub.ftz.f32 	%f110, %f1, %f105;
	sub.ftz.f32 	%f204, %f109, %f110;

BB6_12:
	ld.f32 	%f15, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f15, %f2;
	setp.le.ftz.f32	%p14, %f12, %f2;
	xor.pred  	%p15, %p14, %p13;
	@!%p15 bra 	BB6_14;
	bra.uni 	BB6_13;

BB6_13:
	mov.f32 	%f205, 0fBF800000;
	bra.uni 	BB6_15;

BB6_14:
	ld.f32 	%f112, [%rd1+44];
	ld.f32 	%f113, [%rd1+52];
	ld.f32 	%f114, [%rd1+48];
	sub.ftz.f32 	%f115, %f2, %f114;
	mul.ftz.f32 	%f116, %f113, %f115;
	sub.ftz.f32 	%f117, %f1, %f112;
	sub.ftz.f32 	%f205, %f116, %f117;

BB6_15:
	ld.f32 	%f18, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f18, %f2;
	setp.le.ftz.f32	%p17, %f15, %f2;
	xor.pred  	%p18, %p17, %p16;
	@!%p18 bra 	BB6_17;
	bra.uni 	BB6_16;

BB6_16:
	mov.f32 	%f206, 0fBF800000;
	bra.uni 	BB6_18;

BB6_17:
	ld.f32 	%f119, [%rd1+56];
	ld.f32 	%f120, [%rd1+64];
	ld.f32 	%f121, [%rd1+60];
	sub.ftz.f32 	%f122, %f2, %f121;
	mul.ftz.f32 	%f123, %f120, %f122;
	sub.ftz.f32 	%f124, %f1, %f119;
	sub.ftz.f32 	%f206, %f123, %f124;

BB6_18:
	ld.f32 	%f21, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f21, %f2;
	setp.le.ftz.f32	%p20, %f18, %f2;
	xor.pred  	%p21, %p20, %p19;
	@!%p21 bra 	BB6_20;
	bra.uni 	BB6_19;

BB6_19:
	mov.f32 	%f207, 0fBF800000;
	bra.uni 	BB6_21;

BB6_20:
	ld.f32 	%f126, [%rd1+68];
	ld.f32 	%f127, [%rd1+76];
	ld.f32 	%f128, [%rd1+72];
	sub.ftz.f32 	%f129, %f2, %f128;
	mul.ftz.f32 	%f130, %f127, %f129;
	sub.ftz.f32 	%f131, %f1, %f126;
	sub.ftz.f32 	%f207, %f130, %f131;

BB6_21:
	ld.f32 	%f24, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f24, %f2;
	setp.le.ftz.f32	%p23, %f21, %f2;
	xor.pred  	%p24, %p23, %p22;
	@!%p24 bra 	BB6_23;
	bra.uni 	BB6_22;

BB6_22:
	mov.f32 	%f208, 0fBF800000;
	bra.uni 	BB6_24;

BB6_23:
	ld.f32 	%f133, [%rd1+80];
	ld.f32 	%f134, [%rd1+88];
	ld.f32 	%f135, [%rd1+84];
	sub.ftz.f32 	%f136, %f2, %f135;
	mul.ftz.f32 	%f137, %f134, %f136;
	sub.ftz.f32 	%f138, %f1, %f133;
	sub.ftz.f32 	%f208, %f137, %f138;

BB6_24:
	ld.f32 	%f27, [%rd1+108];
	setp.gt.ftz.f32	%p25, %f27, %f2;
	setp.le.ftz.f32	%p26, %f24, %f2;
	xor.pred  	%p27, %p26, %p25;
	@!%p27 bra 	BB6_26;
	bra.uni 	BB6_25;

BB6_25:
	mov.f32 	%f209, 0fBF800000;
	bra.uni 	BB6_27;

BB6_26:
	ld.f32 	%f140, [%rd1+92];
	ld.f32 	%f141, [%rd1+100];
	ld.f32 	%f142, [%rd1+96];
	sub.ftz.f32 	%f143, %f2, %f142;
	mul.ftz.f32 	%f144, %f141, %f143;
	sub.ftz.f32 	%f145, %f1, %f140;
	sub.ftz.f32 	%f209, %f144, %f145;

BB6_27:
	ld.f32 	%f30, [%rd1+120];
	setp.gt.ftz.f32	%p28, %f30, %f2;
	setp.le.ftz.f32	%p29, %f27, %f2;
	xor.pred  	%p30, %p29, %p28;
	@!%p30 bra 	BB6_29;
	bra.uni 	BB6_28;

BB6_28:
	mov.f32 	%f210, 0fBF800000;
	bra.uni 	BB6_30;

BB6_29:
	ld.f32 	%f147, [%rd1+104];
	ld.f32 	%f148, [%rd1+112];
	ld.f32 	%f149, [%rd1+108];
	sub.ftz.f32 	%f150, %f2, %f149;
	mul.ftz.f32 	%f151, %f148, %f150;
	sub.ftz.f32 	%f152, %f1, %f147;
	sub.ftz.f32 	%f210, %f151, %f152;

BB6_30:
	ld.f32 	%f33, [%rd1+132];
	setp.gt.ftz.f32	%p31, %f33, %f2;
	setp.le.ftz.f32	%p32, %f30, %f2;
	xor.pred  	%p33, %p32, %p31;
	@!%p33 bra 	BB6_32;
	bra.uni 	BB6_31;

BB6_31:
	mov.f32 	%f211, 0fBF800000;
	bra.uni 	BB6_33;

BB6_32:
	ld.f32 	%f154, [%rd1+116];
	ld.f32 	%f155, [%rd1+124];
	ld.f32 	%f156, [%rd1+120];
	sub.ftz.f32 	%f157, %f2, %f156;
	mul.ftz.f32 	%f158, %f155, %f157;
	sub.ftz.f32 	%f159, %f1, %f154;
	sub.ftz.f32 	%f211, %f158, %f159;

BB6_33:
	ld.f32 	%f36, [%rd1+144];
	setp.gt.ftz.f32	%p34, %f36, %f2;
	setp.le.ftz.f32	%p35, %f33, %f2;
	xor.pred  	%p36, %p35, %p34;
	@!%p36 bra 	BB6_35;
	bra.uni 	BB6_34;

BB6_34:
	mov.f32 	%f212, 0fBF800000;
	bra.uni 	BB6_36;

BB6_35:
	ld.f32 	%f161, [%rd1+128];
	ld.f32 	%f162, [%rd1+136];
	ld.f32 	%f163, [%rd1+132];
	sub.ftz.f32 	%f164, %f2, %f163;
	mul.ftz.f32 	%f165, %f162, %f164;
	sub.ftz.f32 	%f166, %f1, %f161;
	sub.ftz.f32 	%f212, %f165, %f166;

BB6_36:
	ld.f32 	%f39, [%rd1+156];
	setp.gt.ftz.f32	%p37, %f39, %f2;
	setp.le.ftz.f32	%p38, %f36, %f2;
	xor.pred  	%p39, %p38, %p37;
	@!%p39 bra 	BB6_38;
	bra.uni 	BB6_37;

BB6_37:
	mov.f32 	%f213, 0fBF800000;
	bra.uni 	BB6_39;

BB6_38:
	ld.f32 	%f168, [%rd1+140];
	ld.f32 	%f169, [%rd1+148];
	ld.f32 	%f170, [%rd1+144];
	sub.ftz.f32 	%f171, %f2, %f170;
	mul.ftz.f32 	%f172, %f169, %f171;
	sub.ftz.f32 	%f173, %f1, %f168;
	sub.ftz.f32 	%f213, %f172, %f173;

BB6_39:
	ld.f32 	%f42, [%rd1+168];
	setp.gt.ftz.f32	%p40, %f42, %f2;
	setp.le.ftz.f32	%p41, %f39, %f2;
	xor.pred  	%p42, %p41, %p40;
	@!%p42 bra 	BB6_41;
	bra.uni 	BB6_40;

BB6_40:
	mov.f32 	%f214, 0fBF800000;
	bra.uni 	BB6_42;

BB6_41:
	ld.f32 	%f175, [%rd1+152];
	ld.f32 	%f176, [%rd1+160];
	ld.f32 	%f177, [%rd1+156];
	sub.ftz.f32 	%f178, %f2, %f177;
	mul.ftz.f32 	%f179, %f176, %f178;
	sub.ftz.f32 	%f180, %f1, %f175;
	sub.ftz.f32 	%f214, %f179, %f180;

BB6_42:
	ld.f32 	%f45, [%rd1+180];
	setp.gt.ftz.f32	%p43, %f45, %f2;
	setp.le.ftz.f32	%p44, %f42, %f2;
	xor.pred  	%p45, %p44, %p43;
	@!%p45 bra 	BB6_44;
	bra.uni 	BB6_43;

BB6_43:
	mov.f32 	%f215, 0fBF800000;
	bra.uni 	BB6_45;

BB6_44:
	ld.f32 	%f182, [%rd1+164];
	ld.f32 	%f183, [%rd1+172];
	ld.f32 	%f184, [%rd1+168];
	sub.ftz.f32 	%f185, %f2, %f184;
	mul.ftz.f32 	%f186, %f183, %f185;
	sub.ftz.f32 	%f187, %f1, %f182;
	sub.ftz.f32 	%f215, %f186, %f187;

BB6_45:
	ld.f32 	%f189, [%rd1+192];
	setp.gt.ftz.f32	%p46, %f189, %f2;
	setp.le.ftz.f32	%p47, %f45, %f2;
	xor.pred  	%p48, %p47, %p46;
	@!%p48 bra 	BB6_47;
	bra.uni 	BB6_46;

BB6_46:
	mov.f32 	%f216, 0fBF800000;
	bra.uni 	BB6_48;

BB6_47:
	ld.f32 	%f190, [%rd1+176];
	ld.f32 	%f191, [%rd1+184];
	ld.f32 	%f192, [%rd1+180];
	sub.ftz.f32 	%f193, %f2, %f192;
	mul.ftz.f32 	%f194, %f191, %f193;
	sub.ftz.f32 	%f195, %f1, %f190;
	sub.ftz.f32 	%f216, %f194, %f195;

BB6_48:
	mov.u32 	%r48, 0;

BB6_49:
	mov.u32 	%r1, %r48;
	cvt.rn.f32.s32	%f50, %r1;
	setp.gt.ftz.f32	%p49, %f201, %f50;
	@%p49 bra 	BB6_51;

	mov.u32 	%r49, 0;
	mov.f32 	%f217, 0f47C35000;
	bra.uni 	BB6_52;

BB6_51:
	mov.f32 	%f198, 0f47C35000;
	min.ftz.f32 	%f217, %f198, %f201;
	mov.u32 	%r49, 1;

BB6_52:
	setp.leu.ftz.f32	%p50, %f202, %f50;
	@%p50 bra 	BB6_54;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f202;

BB6_54:
	setp.leu.ftz.f32	%p51, %f203, %f50;
	@%p51 bra 	BB6_56;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f203;

BB6_56:
	setp.leu.ftz.f32	%p52, %f204, %f50;
	@%p52 bra 	BB6_58;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f204;

BB6_58:
	setp.leu.ftz.f32	%p53, %f205, %f50;
	@%p53 bra 	BB6_60;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f205;

BB6_60:
	setp.leu.ftz.f32	%p54, %f206, %f50;
	@%p54 bra 	BB6_62;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f206;

BB6_62:
	setp.leu.ftz.f32	%p55, %f207, %f50;
	@%p55 bra 	BB6_64;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f207;

BB6_64:
	setp.leu.ftz.f32	%p56, %f208, %f50;
	@%p56 bra 	BB6_66;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f208;

BB6_66:
	setp.leu.ftz.f32	%p57, %f209, %f50;
	@%p57 bra 	BB6_68;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f209;

BB6_68:
	setp.leu.ftz.f32	%p58, %f210, %f50;
	@%p58 bra 	BB6_70;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f210;

BB6_70:
	setp.leu.ftz.f32	%p59, %f211, %f50;
	@%p59 bra 	BB6_72;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f211;

BB6_72:
	setp.leu.ftz.f32	%p60, %f212, %f50;
	@%p60 bra 	BB6_74;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f212;

BB6_74:
	setp.leu.ftz.f32	%p61, %f213, %f50;
	@%p61 bra 	BB6_76;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f213;

BB6_76:
	setp.leu.ftz.f32	%p62, %f214, %f50;
	@%p62 bra 	BB6_78;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f214;

BB6_78:
	setp.leu.ftz.f32	%p63, %f215, %f50;
	@%p63 bra 	BB6_80;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f215;

BB6_80:
	setp.leu.ftz.f32	%p64, %f216, %f50;
	@%p64 bra 	BB6_82;

	xor.b32  	%r49, %r49, 1;
	min.ftz.f32 	%f217, %f217, %f216;

BB6_82:
	add.s32 	%r48, %r1, 8;
	cvt.rn.f32.s32	%f199, %r48;
	setp.ltu.ftz.f32	%p65, %f217, %f199;
	add.s64 	%rd3, %rd11, 12;
	@%p65 bra 	BB6_85;

	setp.ne.s32	%p66, %r49, 0;
	@%p66 bra 	BB6_91;

	mov.u32 	%r43, 0;
	st.u32 	[%rd3], %r43;
	st.u32 	[%rd3+16], %r43;
	st.u32 	[%rd3+32], %r43;
	st.u32 	[%rd3+48], %r43;
	st.u32 	[%rd3+64], %r43;
	st.u32 	[%rd3+80], %r43;
	st.u32 	[%rd3+96], %r43;
	st.u32 	[%rd3+112], %r43;
	bra.uni 	BB6_91;

BB6_85:
	setp.eq.s32	%p67, %r49, 0;
	add.s64 	%rd12, %rd11, 28;
	add.s32 	%r50, %r1, 1;
	@%p67 bra 	BB6_86;
	bra.uni 	BB6_87;

BB6_86:
	add.s64 	%rd12, %rd11, 28;
	mov.u32 	%r46, 0;
	st.u32 	[%rd3], %r46;
	add.s32 	%r50, %r1, 1;

BB6_87:
	mov.u32 	%r51, 1;

BB6_88:
	cvt.rn.f32.s32	%f200, %r50;
	setp.gt.ftz.f32	%p68, %f201, %f200;
	setp.gt.ftz.f32	%p69, %f202, %f200;
	xor.pred  	%p70, %p69, %p68;
	setp.gt.ftz.f32	%p71, %f203, %f200;
	xor.pred  	%p72, %p71, %p70;
	setp.gt.ftz.f32	%p73, %f204, %f200;
	xor.pred  	%p74, %p73, %p72;
	setp.gt.ftz.f32	%p75, %f205, %f200;
	xor.pred  	%p76, %p75, %p74;
	setp.gt.ftz.f32	%p77, %f206, %f200;
	xor.pred  	%p78, %p77, %p76;
	setp.gt.ftz.f32	%p79, %f207, %f200;
	xor.pred  	%p80, %p79, %p78;
	setp.gt.ftz.f32	%p81, %f208, %f200;
	xor.pred  	%p82, %p81, %p80;
	setp.gt.ftz.f32	%p83, %f209, %f200;
	xor.pred  	%p84, %p83, %p82;
	setp.gt.ftz.f32	%p85, %f210, %f200;
	xor.pred  	%p86, %p85, %p84;
	setp.gt.ftz.f32	%p87, %f211, %f200;
	xor.pred  	%p88, %p87, %p86;
	setp.gt.ftz.f32	%p89, %f212, %f200;
	xor.pred  	%p90, %p89, %p88;
	setp.gt.ftz.f32	%p91, %f213, %f200;
	xor.pred  	%p92, %p91, %p90;
	setp.gt.ftz.f32	%p93, %f214, %f200;
	xor.pred  	%p94, %p93, %p92;
	setp.gt.ftz.f32	%p95, %f215, %f200;
	xor.pred  	%p96, %p95, %p94;
	setp.gt.ftz.f32	%p97, %f216, %f200;
	xor.pred  	%p98, %p97, %p96;
	@%p98 bra 	BB6_90;

	mov.u32 	%r47, 0;
	st.u32 	[%rd12], %r47;

BB6_90:
	add.s32 	%r51, %r51, 1;
	add.s64 	%rd12, %rd12, 16;
	add.s32 	%r50, %r50, 1;
	setp.lt.s32	%p99, %r51, 8;
	@%p99 bra 	BB6_88;

BB6_91:
	add.s64 	%rd11, %rd11, 128;
	setp.lt.s32	%p100, %r48, 32;
	@%p100 bra 	BB6_49;

	ret;
}

.visible .func _Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<142>;
	.reg .s32 	%r<39>;
	.reg .f32 	%f<120>;
	.reg .s64 	%rd<7>;


	ld.param.u64 	%rd6, [_Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd5, [_Z13FillSegment32ILi8E6float4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd5, 4;
	ld.f32 	%f43, [%rd5+4];
	setp.le.ftz.f32	%p1, %f43, %f2;
	ld.f32 	%f3, [%rd5+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB7_2;
	bra.uni 	BB7_1;

BB7_1:
	mov.f32 	%f111, 0fBF800000;
	bra.uni 	BB7_3;

BB7_2:
	ld.f32 	%f44, [%rd1+-4];
	ld.f32 	%f45, [%rd1+4];
	ld.f32 	%f46, [%rd1];
	sub.ftz.f32 	%f47, %f2, %f46;
	mul.ftz.f32 	%f48, %f45, %f47;
	sub.ftz.f32 	%f49, %f1, %f44;
	sub.ftz.f32 	%f111, %f48, %f49;

BB7_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB7_5;
	bra.uni 	BB7_4;

BB7_4:
	mov.f32 	%f112, 0fBF800000;
	bra.uni 	BB7_6;

BB7_5:
	ld.f32 	%f51, [%rd1+8];
	ld.f32 	%f52, [%rd1+16];
	ld.f32 	%f53, [%rd1+12];
	sub.ftz.f32 	%f54, %f2, %f53;
	mul.ftz.f32 	%f55, %f52, %f54;
	sub.ftz.f32 	%f56, %f1, %f51;
	sub.ftz.f32 	%f112, %f55, %f56;

BB7_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB7_8;
	bra.uni 	BB7_7;

BB7_7:
	mov.f32 	%f113, 0fBF800000;
	bra.uni 	BB7_9;

BB7_8:
	ld.f32 	%f58, [%rd1+20];
	ld.f32 	%f59, [%rd1+28];
	ld.f32 	%f60, [%rd1+24];
	sub.ftz.f32 	%f61, %f2, %f60;
	mul.ftz.f32 	%f62, %f59, %f61;
	sub.ftz.f32 	%f63, %f1, %f58;
	sub.ftz.f32 	%f113, %f62, %f63;

BB7_9:
	ld.f32 	%f12, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f12, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB7_11;
	bra.uni 	BB7_10;

BB7_10:
	mov.f32 	%f114, 0fBF800000;
	bra.uni 	BB7_12;

BB7_11:
	ld.f32 	%f65, [%rd1+32];
	ld.f32 	%f66, [%rd1+40];
	ld.f32 	%f67, [%rd1+36];
	sub.ftz.f32 	%f68, %f2, %f67;
	mul.ftz.f32 	%f69, %f66, %f68;
	sub.ftz.f32 	%f70, %f1, %f65;
	sub.ftz.f32 	%f114, %f69, %f70;

BB7_12:
	ld.f32 	%f15, [%rd1+60];
	setp.gt.ftz.f32	%p13, %f15, %f2;
	setp.le.ftz.f32	%p14, %f12, %f2;
	xor.pred  	%p15, %p14, %p13;
	@!%p15 bra 	BB7_14;
	bra.uni 	BB7_13;

BB7_13:
	mov.f32 	%f115, 0fBF800000;
	bra.uni 	BB7_15;

BB7_14:
	ld.f32 	%f72, [%rd1+44];
	ld.f32 	%f73, [%rd1+52];
	ld.f32 	%f74, [%rd1+48];
	sub.ftz.f32 	%f75, %f2, %f74;
	mul.ftz.f32 	%f76, %f73, %f75;
	sub.ftz.f32 	%f77, %f1, %f72;
	sub.ftz.f32 	%f115, %f76, %f77;

BB7_15:
	ld.f32 	%f18, [%rd1+72];
	setp.gt.ftz.f32	%p16, %f18, %f2;
	setp.le.ftz.f32	%p17, %f15, %f2;
	xor.pred  	%p18, %p17, %p16;
	@!%p18 bra 	BB7_17;
	bra.uni 	BB7_16;

BB7_16:
	mov.f32 	%f116, 0fBF800000;
	bra.uni 	BB7_18;

BB7_17:
	ld.f32 	%f79, [%rd1+56];
	ld.f32 	%f80, [%rd1+64];
	ld.f32 	%f81, [%rd1+60];
	sub.ftz.f32 	%f82, %f2, %f81;
	mul.ftz.f32 	%f83, %f80, %f82;
	sub.ftz.f32 	%f84, %f1, %f79;
	sub.ftz.f32 	%f116, %f83, %f84;

BB7_18:
	ld.f32 	%f21, [%rd1+84];
	setp.gt.ftz.f32	%p19, %f21, %f2;
	setp.le.ftz.f32	%p20, %f18, %f2;
	xor.pred  	%p21, %p20, %p19;
	@!%p21 bra 	BB7_20;
	bra.uni 	BB7_19;

BB7_19:
	mov.f32 	%f117, 0fBF800000;
	bra.uni 	BB7_21;

BB7_20:
	ld.f32 	%f86, [%rd1+68];
	ld.f32 	%f87, [%rd1+76];
	ld.f32 	%f88, [%rd1+72];
	sub.ftz.f32 	%f89, %f2, %f88;
	mul.ftz.f32 	%f90, %f87, %f89;
	sub.ftz.f32 	%f91, %f1, %f86;
	sub.ftz.f32 	%f117, %f90, %f91;

BB7_21:
	ld.f32 	%f93, [%rd1+96];
	setp.gt.ftz.f32	%p22, %f93, %f2;
	setp.le.ftz.f32	%p23, %f21, %f2;
	xor.pred  	%p24, %p23, %p22;
	@!%p24 bra 	BB7_23;
	bra.uni 	BB7_22;

BB7_22:
	mov.f32 	%f118, 0fBF800000;
	bra.uni 	BB7_24;

BB7_23:
	ld.f32 	%f94, [%rd1+80];
	ld.f32 	%f95, [%rd1+88];
	ld.f32 	%f96, [%rd1+84];
	sub.ftz.f32 	%f97, %f2, %f96;
	mul.ftz.f32 	%f98, %f95, %f97;
	sub.ftz.f32 	%f99, %f1, %f94;
	sub.ftz.f32 	%f118, %f98, %f99;

BB7_24:
	mov.u32 	%r37, 0;

BB7_25:
	mov.u32 	%r1, %r37;
	cvt.rn.f32.s32	%f26, %r1;
	setp.gt.ftz.f32	%p25, %f111, %f26;
	@%p25 bra 	BB7_27;

	mov.u32 	%r38, 0;
	mov.f32 	%f119, 0f47C35000;
	bra.uni 	BB7_28;

BB7_27:
	mov.f32 	%f102, 0f47C35000;
	min.ftz.f32 	%f119, %f102, %f111;
	mov.u32 	%r38, 1;

BB7_28:
	setp.leu.ftz.f32	%p26, %f112, %f26;
	@%p26 bra 	BB7_30;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f112;

BB7_30:
	setp.leu.ftz.f32	%p27, %f113, %f26;
	@%p27 bra 	BB7_32;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f113;

BB7_32:
	setp.leu.ftz.f32	%p28, %f114, %f26;
	@%p28 bra 	BB7_34;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f114;

BB7_34:
	setp.leu.ftz.f32	%p29, %f115, %f26;
	@%p29 bra 	BB7_36;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f115;

BB7_36:
	setp.leu.ftz.f32	%p30, %f116, %f26;
	@%p30 bra 	BB7_38;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f116;

BB7_38:
	setp.leu.ftz.f32	%p31, %f117, %f26;
	@%p31 bra 	BB7_40;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f117;

BB7_40:
	setp.leu.ftz.f32	%p32, %f118, %f26;
	@%p32 bra 	BB7_42;

	xor.b32  	%r38, %r38, 1;
	min.ftz.f32 	%f119, %f119, %f118;

BB7_42:
	add.s32 	%r37, %r1, 8;
	cvt.rn.f32.s32	%f103, %r37;
	setp.ltu.ftz.f32	%p33, %f119, %f103;
	@%p33 bra 	BB7_45;

	setp.ne.s32	%p34, %r38, 0;
	@%p34 bra 	BB7_61;

	mov.u32 	%r21, 0;
	st.u32 	[%rd6+12], %r21;
	st.u32 	[%rd6+28], %r21;
	st.u32 	[%rd6+44], %r21;
	st.u32 	[%rd6+60], %r21;
	st.u32 	[%rd6+76], %r21;
	st.u32 	[%rd6+92], %r21;
	st.u32 	[%rd6+108], %r21;
	st.u32 	[%rd6+124], %r21;
	bra.uni 	BB7_61;

BB7_45:
	setp.ne.s32	%p35, %r38, 0;
	@%p35 bra 	BB7_47;

	mov.u32 	%r22, 0;
	st.u32 	[%rd6+12], %r22;

BB7_47:
	add.s32 	%r23, %r1, 1;
	cvt.rn.f32.s32	%f104, %r23;
	setp.gt.ftz.f32	%p36, %f111, %f104;
	setp.gt.ftz.f32	%p37, %f112, %f104;
	xor.pred  	%p38, %p37, %p36;
	setp.gt.ftz.f32	%p39, %f113, %f104;
	xor.pred  	%p40, %p39, %p38;
	setp.gt.ftz.f32	%p41, %f114, %f104;
	xor.pred  	%p42, %p41, %p40;
	setp.gt.ftz.f32	%p43, %f115, %f104;
	xor.pred  	%p44, %p43, %p42;
	setp.gt.ftz.f32	%p45, %f116, %f104;
	xor.pred  	%p46, %p45, %p44;
	setp.gt.ftz.f32	%p47, %f117, %f104;
	xor.pred  	%p48, %p47, %p46;
	setp.gt.ftz.f32	%p49, %f118, %f104;
	xor.pred  	%p50, %p49, %p48;
	@%p50 bra 	BB7_49;

	mov.u32 	%r24, 0;
	st.u32 	[%rd6+28], %r24;

BB7_49:
	add.s32 	%r25, %r1, 2;
	cvt.rn.f32.s32	%f105, %r25;
	setp.gt.ftz.f32	%p51, %f111, %f105;
	setp.gt.ftz.f32	%p52, %f112, %f105;
	xor.pred  	%p53, %p52, %p51;
	setp.gt.ftz.f32	%p54, %f113, %f105;
	xor.pred  	%p55, %p54, %p53;
	setp.gt.ftz.f32	%p56, %f114, %f105;
	xor.pred  	%p57, %p56, %p55;
	setp.gt.ftz.f32	%p58, %f115, %f105;
	xor.pred  	%p59, %p58, %p57;
	setp.gt.ftz.f32	%p60, %f116, %f105;
	xor.pred  	%p61, %p60, %p59;
	setp.gt.ftz.f32	%p62, %f117, %f105;
	xor.pred  	%p63, %p62, %p61;
	setp.gt.ftz.f32	%p64, %f118, %f105;
	xor.pred  	%p65, %p64, %p63;
	@%p65 bra 	BB7_51;

	mov.u32 	%r26, 0;
	st.u32 	[%rd6+44], %r26;

BB7_51:
	add.s32 	%r27, %r1, 3;
	cvt.rn.f32.s32	%f106, %r27;
	setp.gt.ftz.f32	%p66, %f111, %f106;
	setp.gt.ftz.f32	%p67, %f112, %f106;
	xor.pred  	%p68, %p67, %p66;
	setp.gt.ftz.f32	%p69, %f113, %f106;
	xor.pred  	%p70, %p69, %p68;
	setp.gt.ftz.f32	%p71, %f114, %f106;
	xor.pred  	%p72, %p71, %p70;
	setp.gt.ftz.f32	%p73, %f115, %f106;
	xor.pred  	%p74, %p73, %p72;
	setp.gt.ftz.f32	%p75, %f116, %f106;
	xor.pred  	%p76, %p75, %p74;
	setp.gt.ftz.f32	%p77, %f117, %f106;
	xor.pred  	%p78, %p77, %p76;
	setp.gt.ftz.f32	%p79, %f118, %f106;
	xor.pred  	%p80, %p79, %p78;
	@%p80 bra 	BB7_53;

	mov.u32 	%r28, 0;
	st.u32 	[%rd6+60], %r28;

BB7_53:
	add.s32 	%r29, %r1, 4;
	cvt.rn.f32.s32	%f107, %r29;
	setp.gt.ftz.f32	%p81, %f111, %f107;
	setp.gt.ftz.f32	%p82, %f112, %f107;
	xor.pred  	%p83, %p82, %p81;
	setp.gt.ftz.f32	%p84, %f113, %f107;
	xor.pred  	%p85, %p84, %p83;
	setp.gt.ftz.f32	%p86, %f114, %f107;
	xor.pred  	%p87, %p86, %p85;
	setp.gt.ftz.f32	%p88, %f115, %f107;
	xor.pred  	%p89, %p88, %p87;
	setp.gt.ftz.f32	%p90, %f116, %f107;
	xor.pred  	%p91, %p90, %p89;
	setp.gt.ftz.f32	%p92, %f117, %f107;
	xor.pred  	%p93, %p92, %p91;
	setp.gt.ftz.f32	%p94, %f118, %f107;
	xor.pred  	%p95, %p94, %p93;
	@%p95 bra 	BB7_55;

	mov.u32 	%r30, 0;
	st.u32 	[%rd6+76], %r30;

BB7_55:
	add.s32 	%r31, %r1, 5;
	cvt.rn.f32.s32	%f108, %r31;
	setp.gt.ftz.f32	%p96, %f111, %f108;
	setp.gt.ftz.f32	%p97, %f112, %f108;
	xor.pred  	%p98, %p97, %p96;
	setp.gt.ftz.f32	%p99, %f113, %f108;
	xor.pred  	%p100, %p99, %p98;
	setp.gt.ftz.f32	%p101, %f114, %f108;
	xor.pred  	%p102, %p101, %p100;
	setp.gt.ftz.f32	%p103, %f115, %f108;
	xor.pred  	%p104, %p103, %p102;
	setp.gt.ftz.f32	%p105, %f116, %f108;
	xor.pred  	%p106, %p105, %p104;
	setp.gt.ftz.f32	%p107, %f117, %f108;
	xor.pred  	%p108, %p107, %p106;
	setp.gt.ftz.f32	%p109, %f118, %f108;
	xor.pred  	%p110, %p109, %p108;
	@%p110 bra 	BB7_57;

	mov.u32 	%r32, 0;
	st.u32 	[%rd6+92], %r32;

BB7_57:
	add.s32 	%r33, %r1, 6;
	cvt.rn.f32.s32	%f109, %r33;
	setp.gt.ftz.f32	%p111, %f111, %f109;
	setp.gt.ftz.f32	%p112, %f112, %f109;
	xor.pred  	%p113, %p112, %p111;
	setp.gt.ftz.f32	%p114, %f113, %f109;
	xor.pred  	%p115, %p114, %p113;
	setp.gt.ftz.f32	%p116, %f114, %f109;
	xor.pred  	%p117, %p116, %p115;
	setp.gt.ftz.f32	%p118, %f115, %f109;
	xor.pred  	%p119, %p118, %p117;
	setp.gt.ftz.f32	%p120, %f116, %f109;
	xor.pred  	%p121, %p120, %p119;
	setp.gt.ftz.f32	%p122, %f117, %f109;
	xor.pred  	%p123, %p122, %p121;
	setp.gt.ftz.f32	%p124, %f118, %f109;
	xor.pred  	%p125, %p124, %p123;
	@%p125 bra 	BB7_59;

	mov.u32 	%r34, 0;
	st.u32 	[%rd6+108], %r34;

BB7_59:
	add.s32 	%r35, %r1, 7;
	cvt.rn.f32.s32	%f110, %r35;
	setp.gt.ftz.f32	%p126, %f111, %f110;
	setp.gt.ftz.f32	%p127, %f112, %f110;
	xor.pred  	%p128, %p127, %p126;
	setp.gt.ftz.f32	%p129, %f113, %f110;
	xor.pred  	%p130, %p129, %p128;
	setp.gt.ftz.f32	%p131, %f114, %f110;
	xor.pred  	%p132, %p131, %p130;
	setp.gt.ftz.f32	%p133, %f115, %f110;
	xor.pred  	%p134, %p133, %p132;
	setp.gt.ftz.f32	%p135, %f116, %f110;
	xor.pred  	%p136, %p135, %p134;
	setp.gt.ftz.f32	%p137, %f117, %f110;
	xor.pred  	%p138, %p137, %p136;
	setp.gt.ftz.f32	%p139, %f118, %f110;
	xor.pred  	%p140, %p139, %p138;
	@%p140 bra 	BB7_61;

	mov.u32 	%r36, 0;
	st.u32 	[%rd6+124], %r36;

BB7_61:
	add.s64 	%rd6, %rd6, 128;
	setp.lt.s32	%p141, %r37, 32;
	@%p141 bra 	BB7_25;

	ret;
}

.visible .func _Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3(
	.param .b64 _Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_0,
	.param .align 8 .b8 _Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_1[8],
	.param .b64 _Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_2
)
{
	.reg .pred 	%p<70>;
	.reg .s32 	%r<31>;
	.reg .f32 	%f<68>;
	.reg .s64 	%rd<7>;


	ld.param.u64 	%rd6, [_Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_0];
	ld.param.f32 	%f1, [_Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_1];
	ld.param.f32 	%f2, [_Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_1+4];
	ld.param.u64 	%rd5, [_Z13FillSegment32ILi4E6float4EvPT0_6float2P6float3_param_2];
	add.s64 	%rd1, %rd5, 4;
	ld.f32 	%f23, [%rd5+4];
	setp.le.ftz.f32	%p1, %f23, %f2;
	ld.f32 	%f3, [%rd5+16];
	setp.gt.ftz.f32	%p2, %f3, %f2;
	xor.pred  	%p3, %p1, %p2;
	@!%p3 bra 	BB8_2;
	bra.uni 	BB8_1;

BB8_1:
	mov.f32 	%f63, 0fBF800000;
	bra.uni 	BB8_3;

BB8_2:
	ld.f32 	%f24, [%rd1+-4];
	ld.f32 	%f25, [%rd1+4];
	ld.f32 	%f26, [%rd1];
	sub.ftz.f32 	%f27, %f2, %f26;
	mul.ftz.f32 	%f28, %f25, %f27;
	sub.ftz.f32 	%f29, %f1, %f24;
	sub.ftz.f32 	%f63, %f28, %f29;

BB8_3:
	ld.f32 	%f6, [%rd1+24];
	setp.gt.ftz.f32	%p4, %f6, %f2;
	setp.le.ftz.f32	%p5, %f3, %f2;
	xor.pred  	%p6, %p5, %p4;
	@!%p6 bra 	BB8_5;
	bra.uni 	BB8_4;

BB8_4:
	mov.f32 	%f64, 0fBF800000;
	bra.uni 	BB8_6;

BB8_5:
	ld.f32 	%f31, [%rd1+8];
	ld.f32 	%f32, [%rd1+16];
	ld.f32 	%f33, [%rd1+12];
	sub.ftz.f32 	%f34, %f2, %f33;
	mul.ftz.f32 	%f35, %f32, %f34;
	sub.ftz.f32 	%f36, %f1, %f31;
	sub.ftz.f32 	%f64, %f35, %f36;

BB8_6:
	ld.f32 	%f9, [%rd1+36];
	setp.gt.ftz.f32	%p7, %f9, %f2;
	setp.le.ftz.f32	%p8, %f6, %f2;
	xor.pred  	%p9, %p8, %p7;
	@!%p9 bra 	BB8_8;
	bra.uni 	BB8_7;

BB8_7:
	mov.f32 	%f65, 0fBF800000;
	bra.uni 	BB8_9;

BB8_8:
	ld.f32 	%f38, [%rd1+20];
	ld.f32 	%f39, [%rd1+28];
	ld.f32 	%f40, [%rd1+24];
	sub.ftz.f32 	%f41, %f2, %f40;
	mul.ftz.f32 	%f42, %f39, %f41;
	sub.ftz.f32 	%f43, %f1, %f38;
	sub.ftz.f32 	%f65, %f42, %f43;

BB8_9:
	ld.f32 	%f45, [%rd1+48];
	setp.gt.ftz.f32	%p10, %f45, %f2;
	setp.le.ftz.f32	%p11, %f9, %f2;
	xor.pred  	%p12, %p11, %p10;
	@!%p12 bra 	BB8_11;
	bra.uni 	BB8_10;

BB8_10:
	mov.f32 	%f66, 0fBF800000;
	bra.uni 	BB8_12;

BB8_11:
	ld.f32 	%f46, [%rd1+32];
	ld.f32 	%f47, [%rd1+40];
	ld.f32 	%f48, [%rd1+36];
	sub.ftz.f32 	%f49, %f2, %f48;
	mul.ftz.f32 	%f50, %f47, %f49;
	sub.ftz.f32 	%f51, %f1, %f46;
	sub.ftz.f32 	%f66, %f50, %f51;

BB8_12:
	mov.u32 	%r29, 0;

BB8_13:
	mov.u32 	%r1, %r29;
	cvt.rn.f32.s32	%f14, %r1;
	setp.gt.ftz.f32	%p13, %f63, %f14;
	@%p13 bra 	BB8_15;

	mov.u32 	%r30, 0;
	mov.f32 	%f67, 0f47C35000;
	bra.uni 	BB8_16;

BB8_15:
	mov.f32 	%f54, 0f47C35000;
	min.ftz.f32 	%f67, %f54, %f63;
	mov.u32 	%r30, 1;

BB8_16:
	setp.leu.ftz.f32	%p14, %f64, %f14;
	@%p14 bra 	BB8_18;

	xor.b32  	%r30, %r30, 1;
	min.ftz.f32 	%f67, %f67, %f64;

BB8_18:
	setp.leu.ftz.f32	%p15, %f65, %f14;
	@%p15 bra 	BB8_20;

	xor.b32  	%r30, %r30, 1;
	min.ftz.f32 	%f67, %f67, %f65;

BB8_20:
	setp.leu.ftz.f32	%p16, %f66, %f14;
	@%p16 bra 	BB8_22;

	xor.b32  	%r30, %r30, 1;
	min.ftz.f32 	%f67, %f67, %f66;

BB8_22:
	add.s32 	%r29, %r1, 8;
	cvt.rn.f32.s32	%f55, %r29;
	setp.ltu.ftz.f32	%p17, %f67, %f55;
	@%p17 bra 	BB8_25;

	setp.ne.s32	%p18, %r30, 0;
	@%p18 bra 	BB8_41;

	mov.u32 	%r13, 0;
	st.u32 	[%rd6+12], %r13;
	st.u32 	[%rd6+28], %r13;
	st.u32 	[%rd6+44], %r13;
	st.u32 	[%rd6+60], %r13;
	st.u32 	[%rd6+76], %r13;
	st.u32 	[%rd6+92], %r13;
	st.u32 	[%rd6+108], %r13;
	st.u32 	[%rd6+124], %r13;
	bra.uni 	BB8_41;

BB8_25:
	setp.ne.s32	%p19, %r30, 0;
	@%p19 bra 	BB8_27;

	mov.u32 	%r14, 0;
	st.u32 	[%rd6+12], %r14;

BB8_27:
	add.s32 	%r15, %r1, 1;
	cvt.rn.f32.s32	%f56, %r15;
	setp.gt.ftz.f32	%p20, %f63, %f56;
	setp.gt.ftz.f32	%p21, %f64, %f56;
	xor.pred  	%p22, %p21, %p20;
	setp.gt.ftz.f32	%p23, %f65, %f56;
	xor.pred  	%p24, %p23, %p22;
	setp.gt.ftz.f32	%p25, %f66, %f56;
	xor.pred  	%p26, %p25, %p24;
	@%p26 bra 	BB8_29;

	mov.u32 	%r16, 0;
	st.u32 	[%rd6+28], %r16;

BB8_29:
	add.s32 	%r17, %r1, 2;
	cvt.rn.f32.s32	%f57, %r17;
	setp.gt.ftz.f32	%p27, %f63, %f57;
	setp.gt.ftz.f32	%p28, %f64, %f57;
	xor.pred  	%p29, %p28, %p27;
	setp.gt.ftz.f32	%p30, %f65, %f57;
	xor.pred  	%p31, %p30, %p29;
	setp.gt.ftz.f32	%p32, %f66, %f57;
	xor.pred  	%p33, %p32, %p31;
	@%p33 bra 	BB8_31;

	mov.u32 	%r18, 0;
	st.u32 	[%rd6+44], %r18;

BB8_31:
	add.s32 	%r19, %r1, 3;
	cvt.rn.f32.s32	%f58, %r19;
	setp.gt.ftz.f32	%p34, %f63, %f58;
	setp.gt.ftz.f32	%p35, %f64, %f58;
	xor.pred  	%p36, %p35, %p34;
	setp.gt.ftz.f32	%p37, %f65, %f58;
	xor.pred  	%p38, %p37, %p36;
	setp.gt.ftz.f32	%p39, %f66, %f58;
	xor.pred  	%p40, %p39, %p38;
	@%p40 bra 	BB8_33;

	mov.u32 	%r20, 0;
	st.u32 	[%rd6+60], %r20;

BB8_33:
	add.s32 	%r21, %r1, 4;
	cvt.rn.f32.s32	%f59, %r21;
	setp.gt.ftz.f32	%p41, %f63, %f59;
	setp.gt.ftz.f32	%p42, %f64, %f59;
	xor.pred  	%p43, %p42, %p41;
	setp.gt.ftz.f32	%p44, %f65, %f59;
	xor.pred  	%p45, %p44, %p43;
	setp.gt.ftz.f32	%p46, %f66, %f59;
	xor.pred  	%p47, %p46, %p45;
	@%p47 bra 	BB8_35;

	mov.u32 	%r22, 0;
	st.u32 	[%rd6+76], %r22;

BB8_35:
	add.s32 	%r23, %r1, 5;
	cvt.rn.f32.s32	%f60, %r23;
	setp.gt.ftz.f32	%p48, %f63, %f60;
	setp.gt.ftz.f32	%p49, %f64, %f60;
	xor.pred  	%p50, %p49, %p48;
	setp.gt.ftz.f32	%p51, %f65, %f60;
	xor.pred  	%p52, %p51, %p50;
	setp.gt.ftz.f32	%p53, %f66, %f60;
	xor.pred  	%p54, %p53, %p52;
	@%p54 bra 	BB8_37;

	mov.u32 	%r24, 0;
	st.u32 	[%rd6+92], %r24;

BB8_37:
	add.s32 	%r25, %r1, 6;
	cvt.rn.f32.s32	%f61, %r25;
	setp.gt.ftz.f32	%p55, %f63, %f61;
	setp.gt.ftz.f32	%p56, %f64, %f61;
	xor.pred  	%p57, %p56, %p55;
	setp.gt.ftz.f32	%p58, %f65, %f61;
	xor.pred  	%p59, %p58, %p57;
	setp.gt.ftz.f32	%p60, %f66, %f61;
	xor.pred  	%p61, %p60, %p59;
	@%p61 bra 	BB8_39;

	mov.u32 	%r26, 0;
	st.u32 	[%rd6+108], %r26;

BB8_39:
	add.s32 	%r27, %r1, 7;
	cvt.rn.f32.s32	%f62, %r27;
	setp.gt.ftz.f32	%p62, %f63, %f62;
	setp.gt.ftz.f32	%p63, %f64, %f62;
	xor.pred  	%p64, %p63, %p62;
	setp.gt.ftz.f32	%p65, %f65, %f62;
	xor.pred  	%p66, %p65, %p64;
	setp.gt.ftz.f32	%p67, %f66, %f62;
	xor.pred  	%p68, %p67, %p66;
	@%p68 bra 	BB8_41;

	mov.u32 	%r28, 0;
	st.u32 	[%rd6+124], %r28;

BB8_41:
	add.s64 	%rd6, %rd6, 128;
	setp.lt.s32	%p69, %r29, 32;
	@%p69 bra 	BB8_13;

	ret;
}

.visible .entry cuda_kernel_bitmask(
	.param .u64 cuda_kernel_bitmask_param_0,
	.param .u32 cuda_kernel_bitmask_param_1,
	.param .u32 cuda_kernel_bitmask_param_2,
	.param .u32 cuda_kernel_bitmask_param_3,
	.param .u32 cuda_kernel_bitmask_param_4,
	.param .u32 cuda_kernel_bitmask_param_5
)
{
	.reg .pred 	%p<631>;
	.reg .s16 	%rs<22>;
	.reg .s32 	%r<265>;
	.reg .f32 	%f<853>;
	.reg .s64 	%rd<59>;


	ld.param.u64 	%rd34, [cuda_kernel_bitmask_param_0];
	ld.param.u32 	%r132, [cuda_kernel_bitmask_param_1];
	ld.param.u32 	%r136, [cuda_kernel_bitmask_param_2];
	ld.param.u32 	%r133, [cuda_kernel_bitmask_param_3];
	ld.param.u32 	%r134, [cuda_kernel_bitmask_param_4];
	mov.u32 	%r137, %ntid.x;
	mov.u32 	%r138, %ctaid.x;
	mov.u32 	%r139, %tid.x;
	mad.lo.s32 	%r140, %r137, %r138, %r139;
	shl.b32 	%r141, %r140, 5;
	mov.u32 	%r142, %ntid.y;
	mov.u32 	%r143, %ctaid.y;
	mov.u32 	%r144, %tid.y;
	mad.lo.s32 	%r145, %r142, %r143, %r144;
	setp.ge.s32	%p1, %r145, %r136;
	setp.ge.s32	%p2, %r141, %r132;
	or.pred  	%p3, %p2, %p1;
	@%p3 bra 	BB9_400;

	ld.param.u32 	%r248, [cuda_kernel_bitmask_param_5];
	add.s32 	%r146, %r132, -32;
	min.s32 	%r1, %r146, %r141;
	cvt.rn.f32.s32	%f1, %r1;
	cvt.rn.f32.s32	%f2, %r145;
	mad.lo.s32 	%r156, %r145, %r133, %r1;
	cvt.s64.s32	%rd1, %r156;
	setp.eq.s32	%p4, %r248, 0;
	@%p4 bra 	BB9_201;

	setp.eq.s32	%p5, %r134, 16;
	@%p5 bra 	BB9_109;

	setp.eq.s32	%p6, %r134, 8;
	@%p6 bra 	BB9_47;

	setp.ne.s32	%p7, %r134, 4;
	@%p7 bra 	BB9_400;

	ld.const.f32 	%f283, [polyPoints+4];
	setp.le.ftz.f32	%p8, %f283, %f2;
	ld.const.f32 	%f3, [polyPoints+16];
	setp.gt.ftz.f32	%p9, %f3, %f2;
	xor.pred  	%p10, %p8, %p9;
	@!%p10 bra 	BB9_7;
	bra.uni 	BB9_6;

BB9_6:
	mov.f32 	%f791, 0fBF800000;
	bra.uni 	BB9_8;

BB9_7:
	ld.const.f32 	%f284, [polyPoints+8];
	ld.const.v2.f32 	{%f285, %f286}, [polyPoints];
	sub.ftz.f32 	%f288, %f2, %f286;
	mul.ftz.f32 	%f289, %f284, %f288;
	sub.ftz.f32 	%f291, %f1, %f285;
	sub.ftz.f32 	%f791, %f289, %f291;

BB9_8:
	ld.const.f32 	%f6, [polyPoints+28];
	setp.gt.ftz.f32	%p11, %f6, %f2;
	setp.le.ftz.f32	%p12, %f3, %f2;
	xor.pred  	%p13, %p12, %p11;
	@!%p13 bra 	BB9_10;
	bra.uni 	BB9_9;

BB9_9:
	mov.f32 	%f792, 0fBF800000;
	bra.uni 	BB9_11;

BB9_10:
	ld.const.f32 	%f293, [polyPoints+12];
	ld.const.f32 	%f294, [polyPoints+20];
	ld.const.f32 	%f295, [polyPoints+16];
	sub.ftz.f32 	%f296, %f2, %f295;
	mul.ftz.f32 	%f297, %f294, %f296;
	sub.ftz.f32 	%f298, %f1, %f293;
	sub.ftz.f32 	%f792, %f297, %f298;

BB9_11:
	ld.const.f32 	%f9, [polyPoints+40];
	setp.gt.ftz.f32	%p14, %f9, %f2;
	setp.le.ftz.f32	%p15, %f6, %f2;
	xor.pred  	%p16, %p15, %p14;
	@!%p16 bra 	BB9_13;
	bra.uni 	BB9_12;

BB9_12:
	mov.f32 	%f793, 0fBF800000;
	bra.uni 	BB9_14;

BB9_13:
	ld.const.f32 	%f300, [polyPoints+32];
	ld.const.v2.f32 	{%f301, %f302}, [polyPoints+24];
	sub.ftz.f32 	%f304, %f2, %f302;
	mul.ftz.f32 	%f305, %f300, %f304;
	sub.ftz.f32 	%f307, %f1, %f301;
	sub.ftz.f32 	%f793, %f305, %f307;

BB9_14:
	ld.const.f32 	%f309, [polyPoints+52];
	setp.gt.ftz.f32	%p17, %f309, %f2;
	setp.le.ftz.f32	%p18, %f9, %f2;
	xor.pred  	%p19, %p18, %p17;
	@!%p19 bra 	BB9_16;
	bra.uni 	BB9_15;

BB9_15:
	mov.f32 	%f794, 0fBF800000;
	bra.uni 	BB9_17;

BB9_16:
	ld.const.f32 	%f310, [polyPoints+36];
	ld.const.f32 	%f311, [polyPoints+44];
	ld.const.f32 	%f312, [polyPoints+40];
	sub.ftz.f32 	%f313, %f2, %f312;
	mul.ftz.f32 	%f314, %f311, %f313;
	sub.ftz.f32 	%f315, %f1, %f310;
	sub.ftz.f32 	%f794, %f314, %f315;

BB9_17:
	mad.lo.s32 	%r162, %r133, %r145, %r1;
	cvta.to.global.u64 	%rd35, %rd34;
	mul.wide.s32 	%rd36, %r162, 16;
	add.s64 	%rd37, %rd36, %rd35;
	add.s64 	%rd51, %rd37, 76;
	mov.u32 	%r249, 0;

BB9_18:
	mov.u32 	%r2, %r249;
	cvt.rn.f32.s32	%f14, %r2;
	setp.gt.ftz.f32	%p20, %f791, %f14;
	@%p20 bra 	BB9_20;

	mov.f32 	%f795, 0f47C35000;
	mov.u32 	%r250, 0;
	bra.uni 	BB9_21;

BB9_20:
	mov.f32 	%f318, 0f47C35000;
	min.ftz.f32 	%f795, %f318, %f791;
	mov.u32 	%r250, 1;

BB9_21:
	setp.leu.ftz.f32	%p21, %f792, %f14;
	@%p21 bra 	BB9_23;

	xor.b32  	%r250, %r250, 1;
	min.ftz.f32 	%f795, %f795, %f792;

BB9_23:
	setp.leu.ftz.f32	%p22, %f793, %f14;
	@%p22 bra 	BB9_25;

	xor.b32  	%r250, %r250, 1;
	min.ftz.f32 	%f795, %f795, %f793;

BB9_25:
	setp.leu.ftz.f32	%p23, %f794, %f14;
	@%p23 bra 	BB9_27;

	xor.b32  	%r250, %r250, 1;
	min.ftz.f32 	%f795, %f795, %f794;

BB9_27:
	add.s32 	%r249, %r2, 8;
	cvt.rn.f32.s32	%f319, %r249;
	setp.ltu.ftz.f32	%p24, %f795, %f319;
	add.s64 	%rd4, %rd51, -64;
	@%p24 bra 	BB9_30;

	setp.ne.s32	%p25, %r250, 0;
	@%p25 bra 	BB9_46;

	mov.u32 	%r165, 0;
	st.global.u32 	[%rd4], %r165;
	st.global.u32 	[%rd4+16], %r165;
	st.global.u32 	[%rd4+32], %r165;
	st.global.u32 	[%rd4+48], %r165;
	st.global.u32 	[%rd4+64], %r165;
	st.global.u32 	[%rd4+80], %r165;
	st.global.u32 	[%rd4+96], %r165;
	st.global.u32 	[%rd4+112], %r165;
	bra.uni 	BB9_46;

BB9_30:
	setp.ne.s32	%p26, %r250, 0;
	@%p26 bra 	BB9_32;

	mov.u32 	%r166, 0;
	st.global.u32 	[%rd4], %r166;

BB9_32:
	add.s32 	%r167, %r2, 1;
	cvt.rn.f32.s32	%f320, %r167;
	setp.gt.ftz.f32	%p27, %f791, %f320;
	setp.gt.ftz.f32	%p28, %f792, %f320;
	xor.pred  	%p29, %p28, %p27;
	setp.gt.ftz.f32	%p30, %f793, %f320;
	xor.pred  	%p31, %p30, %p29;
	setp.gt.ftz.f32	%p32, %f794, %f320;
	xor.pred  	%p33, %p32, %p31;
	@%p33 bra 	BB9_34;

	mov.u32 	%r168, 0;
	st.global.u32 	[%rd4+16], %r168;

BB9_34:
	add.s32 	%r169, %r2, 2;
	cvt.rn.f32.s32	%f321, %r169;
	setp.gt.ftz.f32	%p34, %f791, %f321;
	setp.gt.ftz.f32	%p35, %f792, %f321;
	xor.pred  	%p36, %p35, %p34;
	setp.gt.ftz.f32	%p37, %f793, %f321;
	xor.pred  	%p38, %p37, %p36;
	setp.gt.ftz.f32	%p39, %f794, %f321;
	xor.pred  	%p40, %p39, %p38;
	@%p40 bra 	BB9_36;

	mov.u32 	%r170, 0;
	st.global.u32 	[%rd4+32], %r170;

BB9_36:
	add.s32 	%r171, %r2, 3;
	cvt.rn.f32.s32	%f322, %r171;
	setp.gt.ftz.f32	%p41, %f791, %f322;
	setp.gt.ftz.f32	%p42, %f792, %f322;
	xor.pred  	%p43, %p42, %p41;
	setp.gt.ftz.f32	%p44, %f793, %f322;
	xor.pred  	%p45, %p44, %p43;
	setp.gt.ftz.f32	%p46, %f794, %f322;
	xor.pred  	%p47, %p46, %p45;
	@%p47 bra 	BB9_38;

	mov.u32 	%r172, 0;
	st.global.u32 	[%rd4+48], %r172;

BB9_38:
	add.s32 	%r173, %r2, 4;
	cvt.rn.f32.s32	%f323, %r173;
	setp.gt.ftz.f32	%p48, %f791, %f323;
	setp.gt.ftz.f32	%p49, %f792, %f323;
	xor.pred  	%p50, %p49, %p48;
	setp.gt.ftz.f32	%p51, %f793, %f323;
	xor.pred  	%p52, %p51, %p50;
	setp.gt.ftz.f32	%p53, %f794, %f323;
	xor.pred  	%p54, %p53, %p52;
	@%p54 bra 	BB9_40;

	mov.u32 	%r174, 0;
	st.global.u32 	[%rd4+64], %r174;

BB9_40:
	add.s32 	%r175, %r2, 5;
	cvt.rn.f32.s32	%f324, %r175;
	setp.gt.ftz.f32	%p55, %f791, %f324;
	setp.gt.ftz.f32	%p56, %f792, %f324;
	xor.pred  	%p57, %p56, %p55;
	setp.gt.ftz.f32	%p58, %f793, %f324;
	xor.pred  	%p59, %p58, %p57;
	setp.gt.ftz.f32	%p60, %f794, %f324;
	xor.pred  	%p61, %p60, %p59;
	@%p61 bra 	BB9_42;

	mov.u32 	%r176, 0;
	st.global.u32 	[%rd4+80], %r176;

BB9_42:
	add.s32 	%r177, %r2, 6;
	cvt.rn.f32.s32	%f325, %r177;
	setp.gt.ftz.f32	%p62, %f791, %f325;
	setp.gt.ftz.f32	%p63, %f792, %f325;
	xor.pred  	%p64, %p63, %p62;
	setp.gt.ftz.f32	%p65, %f793, %f325;
	xor.pred  	%p66, %p65, %p64;
	setp.gt.ftz.f32	%p67, %f794, %f325;
	xor.pred  	%p68, %p67, %p66;
	@%p68 bra 	BB9_44;

	mov.u32 	%r178, 0;
	st.global.u32 	[%rd4+96], %r178;

BB9_44:
	add.s32 	%r179, %r2, 7;
	cvt.rn.f32.s32	%f326, %r179;
	setp.gt.ftz.f32	%p69, %f791, %f326;
	setp.gt.ftz.f32	%p70, %f792, %f326;
	xor.pred  	%p71, %p70, %p69;
	setp.gt.ftz.f32	%p72, %f793, %f326;
	xor.pred  	%p73, %p72, %p71;
	setp.gt.ftz.f32	%p74, %f794, %f326;
	xor.pred  	%p75, %p74, %p73;
	@%p75 bra 	BB9_46;

	mov.u32 	%r180, 0;
	st.global.u32 	[%rd4+112], %r180;

BB9_46:
	add.s64 	%rd51, %rd51, 128;
	setp.lt.s32	%p76, %r249, 32;
	@%p76 bra 	BB9_18;
	bra.uni 	BB9_400;

BB9_47:
	ld.const.f32 	%f327, [polyPoints+4];
	setp.le.ftz.f32	%p77, %f327, %f2;
	ld.const.f32 	%f23, [polyPoints+16];
	setp.gt.ftz.f32	%p78, %f23, %f2;
	xor.pred  	%p79, %p77, %p78;
	@!%p79 bra 	BB9_49;
	bra.uni 	BB9_48;

BB9_48:
	mov.f32 	%f796, 0fBF800000;
	bra.uni 	BB9_50;

BB9_49:
	ld.const.f32 	%f328, [polyPoints+8];
	ld.const.v2.f32 	{%f329, %f330}, [polyPoints];
	sub.ftz.f32 	%f332, %f2, %f330;
	mul.ftz.f32 	%f333, %f328, %f332;
	sub.ftz.f32 	%f335, %f1, %f329;
	sub.ftz.f32 	%f796, %f333, %f335;

BB9_50:
	ld.const.f32 	%f26, [polyPoints+28];
	setp.gt.ftz.f32	%p80, %f26, %f2;
	setp.le.ftz.f32	%p81, %f23, %f2;
	xor.pred  	%p82, %p81, %p80;
	@!%p82 bra 	BB9_52;
	bra.uni 	BB9_51;

BB9_51:
	mov.f32 	%f797, 0fBF800000;
	bra.uni 	BB9_53;

BB9_52:
	ld.const.f32 	%f337, [polyPoints+12];
	ld.const.f32 	%f338, [polyPoints+20];
	ld.const.f32 	%f339, [polyPoints+16];
	sub.ftz.f32 	%f340, %f2, %f339;
	mul.ftz.f32 	%f341, %f338, %f340;
	sub.ftz.f32 	%f342, %f1, %f337;
	sub.ftz.f32 	%f797, %f341, %f342;

BB9_53:
	ld.const.f32 	%f29, [polyPoints+40];
	setp.gt.ftz.f32	%p83, %f29, %f2;
	setp.le.ftz.f32	%p84, %f26, %f2;
	xor.pred  	%p85, %p84, %p83;
	@!%p85 bra 	BB9_55;
	bra.uni 	BB9_54;

BB9_54:
	mov.f32 	%f798, 0fBF800000;
	bra.uni 	BB9_56;

BB9_55:
	ld.const.f32 	%f344, [polyPoints+32];
	ld.const.v2.f32 	{%f345, %f346}, [polyPoints+24];
	sub.ftz.f32 	%f348, %f2, %f346;
	mul.ftz.f32 	%f349, %f344, %f348;
	sub.ftz.f32 	%f351, %f1, %f345;
	sub.ftz.f32 	%f798, %f349, %f351;

BB9_56:
	ld.const.f32 	%f32, [polyPoints+52];
	setp.gt.ftz.f32	%p86, %f32, %f2;
	setp.le.ftz.f32	%p87, %f29, %f2;
	xor.pred  	%p88, %p87, %p86;
	@!%p88 bra 	BB9_58;
	bra.uni 	BB9_57;

BB9_57:
	mov.f32 	%f799, 0fBF800000;
	bra.uni 	BB9_59;

BB9_58:
	ld.const.f32 	%f353, [polyPoints+36];
	ld.const.f32 	%f354, [polyPoints+44];
	ld.const.f32 	%f355, [polyPoints+40];
	sub.ftz.f32 	%f356, %f2, %f355;
	mul.ftz.f32 	%f357, %f354, %f356;
	sub.ftz.f32 	%f358, %f1, %f353;
	sub.ftz.f32 	%f799, %f357, %f358;

BB9_59:
	ld.const.f32 	%f35, [polyPoints+64];
	setp.gt.ftz.f32	%p89, %f35, %f2;
	setp.le.ftz.f32	%p90, %f32, %f2;
	xor.pred  	%p91, %p90, %p89;
	@!%p91 bra 	BB9_61;
	bra.uni 	BB9_60;

BB9_60:
	mov.f32 	%f800, 0fBF800000;
	bra.uni 	BB9_62;

BB9_61:
	ld.const.f32 	%f360, [polyPoints+56];
	ld.const.v2.f32 	{%f361, %f362}, [polyPoints+48];
	sub.ftz.f32 	%f364, %f2, %f362;
	mul.ftz.f32 	%f365, %f360, %f364;
	sub.ftz.f32 	%f367, %f1, %f361;
	sub.ftz.f32 	%f800, %f365, %f367;

BB9_62:
	ld.const.f32 	%f38, [polyPoints+76];
	setp.gt.ftz.f32	%p92, %f38, %f2;
	setp.le.ftz.f32	%p93, %f35, %f2;
	xor.pred  	%p94, %p93, %p92;
	@!%p94 bra 	BB9_64;
	bra.uni 	BB9_63;

BB9_63:
	mov.f32 	%f801, 0fBF800000;
	bra.uni 	BB9_65;

BB9_64:
	ld.const.f32 	%f369, [polyPoints+60];
	ld.const.f32 	%f370, [polyPoints+68];
	ld.const.f32 	%f371, [polyPoints+64];
	sub.ftz.f32 	%f372, %f2, %f371;
	mul.ftz.f32 	%f373, %f370, %f372;
	sub.ftz.f32 	%f374, %f1, %f369;
	sub.ftz.f32 	%f801, %f373, %f374;

BB9_65:
	ld.const.f32 	%f41, [polyPoints+88];
	setp.gt.ftz.f32	%p95, %f41, %f2;
	setp.le.ftz.f32	%p96, %f38, %f2;
	xor.pred  	%p97, %p96, %p95;
	@!%p97 bra 	BB9_67;
	bra.uni 	BB9_66;

BB9_66:
	mov.f32 	%f802, 0fBF800000;
	bra.uni 	BB9_68;

BB9_67:
	ld.const.f32 	%f376, [polyPoints+80];
	ld.const.v2.f32 	{%f377, %f378}, [polyPoints+72];
	sub.ftz.f32 	%f380, %f2, %f378;
	mul.ftz.f32 	%f381, %f376, %f380;
	sub.ftz.f32 	%f383, %f1, %f377;
	sub.ftz.f32 	%f802, %f381, %f383;

BB9_68:
	ld.const.f32 	%f385, [polyPoints+100];
	setp.gt.ftz.f32	%p98, %f385, %f2;
	setp.le.ftz.f32	%p99, %f41, %f2;
	xor.pred  	%p100, %p99, %p98;
	@!%p100 bra 	BB9_70;
	bra.uni 	BB9_69;

BB9_69:
	mov.f32 	%f803, 0fBF800000;
	bra.uni 	BB9_71;

BB9_70:
	ld.const.f32 	%f386, [polyPoints+84];
	ld.const.f32 	%f387, [polyPoints+92];
	ld.const.f32 	%f388, [polyPoints+88];
	sub.ftz.f32 	%f389, %f2, %f388;
	mul.ftz.f32 	%f390, %f387, %f389;
	sub.ftz.f32 	%f391, %f1, %f386;
	sub.ftz.f32 	%f803, %f390, %f391;

BB9_71:
	mad.lo.s32 	%r186, %r133, %r145, %r1;
	cvta.to.global.u64 	%rd38, %rd34;
	mul.wide.s32 	%rd39, %r186, 16;
	add.s64 	%rd40, %rd39, %rd38;
	add.s64 	%rd52, %rd40, 76;
	mov.u32 	%r251, 0;

BB9_72:
	mov.u32 	%r11, %r251;
	cvt.rn.f32.s32	%f46, %r11;
	setp.gt.ftz.f32	%p101, %f796, %f46;
	@%p101 bra 	BB9_74;

	mov.f32 	%f804, 0f47C35000;
	mov.u32 	%r252, 0;
	bra.uni 	BB9_75;

BB9_74:
	mov.f32 	%f394, 0f47C35000;
	min.ftz.f32 	%f804, %f394, %f796;
	mov.u32 	%r252, 1;

BB9_75:
	setp.leu.ftz.f32	%p102, %f797, %f46;
	@%p102 bra 	BB9_77;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f797;

BB9_77:
	setp.leu.ftz.f32	%p103, %f798, %f46;
	@%p103 bra 	BB9_79;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f798;

BB9_79:
	setp.leu.ftz.f32	%p104, %f799, %f46;
	@%p104 bra 	BB9_81;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f799;

BB9_81:
	setp.leu.ftz.f32	%p105, %f800, %f46;
	@%p105 bra 	BB9_83;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f800;

BB9_83:
	setp.leu.ftz.f32	%p106, %f801, %f46;
	@%p106 bra 	BB9_85;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f801;

BB9_85:
	setp.leu.ftz.f32	%p107, %f802, %f46;
	@%p107 bra 	BB9_87;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f802;

BB9_87:
	setp.leu.ftz.f32	%p108, %f803, %f46;
	@%p108 bra 	BB9_89;

	xor.b32  	%r252, %r252, 1;
	min.ftz.f32 	%f804, %f804, %f803;

BB9_89:
	add.s32 	%r251, %r11, 8;
	cvt.rn.f32.s32	%f395, %r251;
	setp.ltu.ftz.f32	%p109, %f804, %f395;
	add.s64 	%rd8, %rd52, -64;
	@%p109 bra 	BB9_92;

	setp.ne.s32	%p110, %r252, 0;
	@%p110 bra 	BB9_108;

	mov.u32 	%r189, 0;
	st.global.u32 	[%rd8], %r189;
	st.global.u32 	[%rd8+16], %r189;
	st.global.u32 	[%rd8+32], %r189;
	st.global.u32 	[%rd8+48], %r189;
	st.global.u32 	[%rd8+64], %r189;
	st.global.u32 	[%rd8+80], %r189;
	st.global.u32 	[%rd8+96], %r189;
	st.global.u32 	[%rd8+112], %r189;
	bra.uni 	BB9_108;

BB9_92:
	setp.ne.s32	%p111, %r252, 0;
	@%p111 bra 	BB9_94;

	mov.u32 	%r190, 0;
	st.global.u32 	[%rd8], %r190;

BB9_94:
	add.s32 	%r191, %r11, 1;
	cvt.rn.f32.s32	%f396, %r191;
	setp.gt.ftz.f32	%p112, %f796, %f396;
	setp.gt.ftz.f32	%p113, %f797, %f396;
	xor.pred  	%p114, %p113, %p112;
	setp.gt.ftz.f32	%p115, %f798, %f396;
	xor.pred  	%p116, %p115, %p114;
	setp.gt.ftz.f32	%p117, %f799, %f396;
	xor.pred  	%p118, %p117, %p116;
	setp.gt.ftz.f32	%p119, %f800, %f396;
	xor.pred  	%p120, %p119, %p118;
	setp.gt.ftz.f32	%p121, %f801, %f396;
	xor.pred  	%p122, %p121, %p120;
	setp.gt.ftz.f32	%p123, %f802, %f396;
	xor.pred  	%p124, %p123, %p122;
	setp.gt.ftz.f32	%p125, %f803, %f396;
	xor.pred  	%p126, %p125, %p124;
	@%p126 bra 	BB9_96;

	mov.u32 	%r192, 0;
	st.global.u32 	[%rd8+16], %r192;

BB9_96:
	add.s32 	%r193, %r11, 2;
	cvt.rn.f32.s32	%f397, %r193;
	setp.gt.ftz.f32	%p127, %f796, %f397;
	setp.gt.ftz.f32	%p128, %f797, %f397;
	xor.pred  	%p129, %p128, %p127;
	setp.gt.ftz.f32	%p130, %f798, %f397;
	xor.pred  	%p131, %p130, %p129;
	setp.gt.ftz.f32	%p132, %f799, %f397;
	xor.pred  	%p133, %p132, %p131;
	setp.gt.ftz.f32	%p134, %f800, %f397;
	xor.pred  	%p135, %p134, %p133;
	setp.gt.ftz.f32	%p136, %f801, %f397;
	xor.pred  	%p137, %p136, %p135;
	setp.gt.ftz.f32	%p138, %f802, %f397;
	xor.pred  	%p139, %p138, %p137;
	setp.gt.ftz.f32	%p140, %f803, %f397;
	xor.pred  	%p141, %p140, %p139;
	@%p141 bra 	BB9_98;

	mov.u32 	%r194, 0;
	st.global.u32 	[%rd8+32], %r194;

BB9_98:
	add.s32 	%r195, %r11, 3;
	cvt.rn.f32.s32	%f398, %r195;
	setp.gt.ftz.f32	%p142, %f796, %f398;
	setp.gt.ftz.f32	%p143, %f797, %f398;
	xor.pred  	%p144, %p143, %p142;
	setp.gt.ftz.f32	%p145, %f798, %f398;
	xor.pred  	%p146, %p145, %p144;
	setp.gt.ftz.f32	%p147, %f799, %f398;
	xor.pred  	%p148, %p147, %p146;
	setp.gt.ftz.f32	%p149, %f800, %f398;
	xor.pred  	%p150, %p149, %p148;
	setp.gt.ftz.f32	%p151, %f801, %f398;
	xor.pred  	%p152, %p151, %p150;
	setp.gt.ftz.f32	%p153, %f802, %f398;
	xor.pred  	%p154, %p153, %p152;
	setp.gt.ftz.f32	%p155, %f803, %f398;
	xor.pred  	%p156, %p155, %p154;
	@%p156 bra 	BB9_100;

	mov.u32 	%r196, 0;
	st.global.u32 	[%rd8+48], %r196;

BB9_100:
	add.s32 	%r197, %r11, 4;
	cvt.rn.f32.s32	%f399, %r197;
	setp.gt.ftz.f32	%p157, %f796, %f399;
	setp.gt.ftz.f32	%p158, %f797, %f399;
	xor.pred  	%p159, %p158, %p157;
	setp.gt.ftz.f32	%p160, %f798, %f399;
	xor.pred  	%p161, %p160, %p159;
	setp.gt.ftz.f32	%p162, %f799, %f399;
	xor.pred  	%p163, %p162, %p161;
	setp.gt.ftz.f32	%p164, %f800, %f399;
	xor.pred  	%p165, %p164, %p163;
	setp.gt.ftz.f32	%p166, %f801, %f399;
	xor.pred  	%p167, %p166, %p165;
	setp.gt.ftz.f32	%p168, %f802, %f399;
	xor.pred  	%p169, %p168, %p167;
	setp.gt.ftz.f32	%p170, %f803, %f399;
	xor.pred  	%p171, %p170, %p169;
	@%p171 bra 	BB9_102;

	mov.u32 	%r198, 0;
	st.global.u32 	[%rd8+64], %r198;

BB9_102:
	add.s32 	%r199, %r11, 5;
	cvt.rn.f32.s32	%f400, %r199;
	setp.gt.ftz.f32	%p172, %f796, %f400;
	setp.gt.ftz.f32	%p173, %f797, %f400;
	xor.pred  	%p174, %p173, %p172;
	setp.gt.ftz.f32	%p175, %f798, %f400;
	xor.pred  	%p176, %p175, %p174;
	setp.gt.ftz.f32	%p177, %f799, %f400;
	xor.pred  	%p178, %p177, %p176;
	setp.gt.ftz.f32	%p179, %f800, %f400;
	xor.pred  	%p180, %p179, %p178;
	setp.gt.ftz.f32	%p181, %f801, %f400;
	xor.pred  	%p182, %p181, %p180;
	setp.gt.ftz.f32	%p183, %f802, %f400;
	xor.pred  	%p184, %p183, %p182;
	setp.gt.ftz.f32	%p185, %f803, %f400;
	xor.pred  	%p186, %p185, %p184;
	@%p186 bra 	BB9_104;

	mov.u32 	%r200, 0;
	st.global.u32 	[%rd8+80], %r200;

BB9_104:
	add.s32 	%r201, %r11, 6;
	cvt.rn.f32.s32	%f401, %r201;
	setp.gt.ftz.f32	%p187, %f796, %f401;
	setp.gt.ftz.f32	%p188, %f797, %f401;
	xor.pred  	%p189, %p188, %p187;
	setp.gt.ftz.f32	%p190, %f798, %f401;
	xor.pred  	%p191, %p190, %p189;
	setp.gt.ftz.f32	%p192, %f799, %f401;
	xor.pred  	%p193, %p192, %p191;
	setp.gt.ftz.f32	%p194, %f800, %f401;
	xor.pred  	%p195, %p194, %p193;
	setp.gt.ftz.f32	%p196, %f801, %f401;
	xor.pred  	%p197, %p196, %p195;
	setp.gt.ftz.f32	%p198, %f802, %f401;
	xor.pred  	%p199, %p198, %p197;
	setp.gt.ftz.f32	%p200, %f803, %f401;
	xor.pred  	%p201, %p200, %p199;
	@%p201 bra 	BB9_106;

	mov.u32 	%r202, 0;
	st.global.u32 	[%rd8+96], %r202;

BB9_106:
	add.s32 	%r203, %r11, 7;
	cvt.rn.f32.s32	%f402, %r203;
	setp.gt.ftz.f32	%p202, %f796, %f402;
	setp.gt.ftz.f32	%p203, %f797, %f402;
	xor.pred  	%p204, %p203, %p202;
	setp.gt.ftz.f32	%p205, %f798, %f402;
	xor.pred  	%p206, %p205, %p204;
	setp.gt.ftz.f32	%p207, %f799, %f402;
	xor.pred  	%p208, %p207, %p206;
	setp.gt.ftz.f32	%p209, %f800, %f402;
	xor.pred  	%p210, %p209, %p208;
	setp.gt.ftz.f32	%p211, %f801, %f402;
	xor.pred  	%p212, %p211, %p210;
	setp.gt.ftz.f32	%p213, %f802, %f402;
	xor.pred  	%p214, %p213, %p212;
	setp.gt.ftz.f32	%p215, %f803, %f402;
	xor.pred  	%p216, %p215, %p214;
	@%p216 bra 	BB9_108;

	mov.u32 	%r204, 0;
	st.global.u32 	[%rd8+112], %r204;

BB9_108:
	add.s64 	%rd52, %rd52, 128;
	setp.lt.s32	%p217, %r251, 32;
	@%p217 bra 	BB9_72;
	bra.uni 	BB9_400;

BB9_109:
	ld.const.f32 	%f403, [polyPoints+4];
	setp.le.ftz.f32	%p218, %f403, %f2;
	ld.const.f32 	%f63, [polyPoints+16];
	setp.gt.ftz.f32	%p219, %f63, %f2;
	xor.pred  	%p220, %p218, %p219;
	@!%p220 bra 	BB9_111;
	bra.uni 	BB9_110;

BB9_110:
	mov.f32 	%f805, 0fBF800000;
	bra.uni 	BB9_112;

BB9_111:
	ld.const.f32 	%f404, [polyPoints+8];
	ld.const.v2.f32 	{%f405, %f406}, [polyPoints];
	sub.ftz.f32 	%f408, %f2, %f406;
	mul.ftz.f32 	%f409, %f404, %f408;
	sub.ftz.f32 	%f411, %f1, %f405;
	sub.ftz.f32 	%f805, %f409, %f411;

BB9_112:
	ld.const.f32 	%f66, [polyPoints+28];
	setp.gt.ftz.f32	%p221, %f66, %f2;
	setp.le.ftz.f32	%p222, %f63, %f2;
	xor.pred  	%p223, %p222, %p221;
	@!%p223 bra 	BB9_114;
	bra.uni 	BB9_113;

BB9_113:
	mov.f32 	%f806, 0fBF800000;
	bra.uni 	BB9_115;

BB9_114:
	ld.const.f32 	%f413, [polyPoints+12];
	ld.const.f32 	%f414, [polyPoints+20];
	ld.const.f32 	%f415, [polyPoints+16];
	sub.ftz.f32 	%f416, %f2, %f415;
	mul.ftz.f32 	%f417, %f414, %f416;
	sub.ftz.f32 	%f418, %f1, %f413;
	sub.ftz.f32 	%f806, %f417, %f418;

BB9_115:
	ld.const.f32 	%f69, [polyPoints+40];
	setp.gt.ftz.f32	%p224, %f69, %f2;
	setp.le.ftz.f32	%p225, %f66, %f2;
	xor.pred  	%p226, %p225, %p224;
	@!%p226 bra 	BB9_117;
	bra.uni 	BB9_116;

BB9_116:
	mov.f32 	%f807, 0fBF800000;
	bra.uni 	BB9_118;

BB9_117:
	ld.const.f32 	%f420, [polyPoints+32];
	ld.const.v2.f32 	{%f421, %f422}, [polyPoints+24];
	sub.ftz.f32 	%f424, %f2, %f422;
	mul.ftz.f32 	%f425, %f420, %f424;
	sub.ftz.f32 	%f427, %f1, %f421;
	sub.ftz.f32 	%f807, %f425, %f427;

BB9_118:
	ld.const.f32 	%f72, [polyPoints+52];
	setp.gt.ftz.f32	%p227, %f72, %f2;
	setp.le.ftz.f32	%p228, %f69, %f2;
	xor.pred  	%p229, %p228, %p227;
	@!%p229 bra 	BB9_120;
	bra.uni 	BB9_119;

BB9_119:
	mov.f32 	%f808, 0fBF800000;
	bra.uni 	BB9_121;

BB9_120:
	ld.const.f32 	%f429, [polyPoints+36];
	ld.const.f32 	%f430, [polyPoints+44];
	ld.const.f32 	%f431, [polyPoints+40];
	sub.ftz.f32 	%f432, %f2, %f431;
	mul.ftz.f32 	%f433, %f430, %f432;
	sub.ftz.f32 	%f434, %f1, %f429;
	sub.ftz.f32 	%f808, %f433, %f434;

BB9_121:
	ld.const.f32 	%f75, [polyPoints+64];
	setp.gt.ftz.f32	%p230, %f75, %f2;
	setp.le.ftz.f32	%p231, %f72, %f2;
	xor.pred  	%p232, %p231, %p230;
	@!%p232 bra 	BB9_123;
	bra.uni 	BB9_122;

BB9_122:
	mov.f32 	%f809, 0fBF800000;
	bra.uni 	BB9_124;

BB9_123:
	ld.const.f32 	%f436, [polyPoints+56];
	ld.const.v2.f32 	{%f437, %f438}, [polyPoints+48];
	sub.ftz.f32 	%f440, %f2, %f438;
	mul.ftz.f32 	%f441, %f436, %f440;
	sub.ftz.f32 	%f443, %f1, %f437;
	sub.ftz.f32 	%f809, %f441, %f443;

BB9_124:
	ld.const.f32 	%f78, [polyPoints+76];
	setp.gt.ftz.f32	%p233, %f78, %f2;
	setp.le.ftz.f32	%p234, %f75, %f2;
	xor.pred  	%p235, %p234, %p233;
	@!%p235 bra 	BB9_126;
	bra.uni 	BB9_125;

BB9_125:
	mov.f32 	%f810, 0fBF800000;
	bra.uni 	BB9_127;

BB9_126:
	ld.const.f32 	%f445, [polyPoints+60];
	ld.const.f32 	%f446, [polyPoints+68];
	ld.const.f32 	%f447, [polyPoints+64];
	sub.ftz.f32 	%f448, %f2, %f447;
	mul.ftz.f32 	%f449, %f446, %f448;
	sub.ftz.f32 	%f450, %f1, %f445;
	sub.ftz.f32 	%f810, %f449, %f450;

BB9_127:
	ld.const.f32 	%f81, [polyPoints+88];
	setp.gt.ftz.f32	%p236, %f81, %f2;
	setp.le.ftz.f32	%p237, %f78, %f2;
	xor.pred  	%p238, %p237, %p236;
	@!%p238 bra 	BB9_129;
	bra.uni 	BB9_128;

BB9_128:
	mov.f32 	%f811, 0fBF800000;
	bra.uni 	BB9_130;

BB9_129:
	ld.const.f32 	%f452, [polyPoints+80];
	ld.const.v2.f32 	{%f453, %f454}, [polyPoints+72];
	sub.ftz.f32 	%f456, %f2, %f454;
	mul.ftz.f32 	%f457, %f452, %f456;
	sub.ftz.f32 	%f459, %f1, %f453;
	sub.ftz.f32 	%f811, %f457, %f459;

BB9_130:
	ld.const.f32 	%f84, [polyPoints+100];
	setp.gt.ftz.f32	%p239, %f84, %f2;
	setp.le.ftz.f32	%p240, %f81, %f2;
	xor.pred  	%p241, %p240, %p239;
	@!%p241 bra 	BB9_132;
	bra.uni 	BB9_131;

BB9_131:
	mov.f32 	%f812, 0fBF800000;
	bra.uni 	BB9_133;

BB9_132:
	ld.const.f32 	%f461, [polyPoints+84];
	ld.const.f32 	%f462, [polyPoints+92];
	ld.const.f32 	%f463, [polyPoints+88];
	sub.ftz.f32 	%f464, %f2, %f463;
	mul.ftz.f32 	%f465, %f462, %f464;
	sub.ftz.f32 	%f466, %f1, %f461;
	sub.ftz.f32 	%f812, %f465, %f466;

BB9_133:
	ld.const.f32 	%f87, [polyPoints+112];
	setp.gt.ftz.f32	%p242, %f87, %f2;
	setp.le.ftz.f32	%p243, %f84, %f2;
	xor.pred  	%p244, %p243, %p242;
	@!%p244 bra 	BB9_135;
	bra.uni 	BB9_134;

BB9_134:
	mov.f32 	%f813, 0fBF800000;
	bra.uni 	BB9_136;

BB9_135:
	ld.const.f32 	%f468, [polyPoints+104];
	ld.const.v2.f32 	{%f469, %f470}, [polyPoints+96];
	sub.ftz.f32 	%f472, %f2, %f470;
	mul.ftz.f32 	%f473, %f468, %f472;
	sub.ftz.f32 	%f475, %f1, %f469;
	sub.ftz.f32 	%f813, %f473, %f475;

BB9_136:
	ld.const.f32 	%f90, [polyPoints+124];
	setp.gt.ftz.f32	%p245, %f90, %f2;
	setp.le.ftz.f32	%p246, %f87, %f2;
	xor.pred  	%p247, %p246, %p245;
	@!%p247 bra 	BB9_138;
	bra.uni 	BB9_137;

BB9_137:
	mov.f32 	%f814, 0fBF800000;
	bra.uni 	BB9_139;

BB9_138:
	ld.const.f32 	%f477, [polyPoints+108];
	ld.const.f32 	%f478, [polyPoints+116];
	ld.const.f32 	%f479, [polyPoints+112];
	sub.ftz.f32 	%f480, %f2, %f479;
	mul.ftz.f32 	%f481, %f478, %f480;
	sub.ftz.f32 	%f482, %f1, %f477;
	sub.ftz.f32 	%f814, %f481, %f482;

BB9_139:
	ld.const.f32 	%f93, [polyPoints+136];
	setp.gt.ftz.f32	%p248, %f93, %f2;
	setp.le.ftz.f32	%p249, %f90, %f2;
	xor.pred  	%p250, %p249, %p248;
	@!%p250 bra 	BB9_141;
	bra.uni 	BB9_140;

BB9_140:
	mov.f32 	%f815, 0fBF800000;
	bra.uni 	BB9_142;

BB9_141:
	ld.const.f32 	%f484, [polyPoints+128];
	ld.const.v2.f32 	{%f485, %f486}, [polyPoints+120];
	sub.ftz.f32 	%f488, %f2, %f486;
	mul.ftz.f32 	%f489, %f484, %f488;
	sub.ftz.f32 	%f491, %f1, %f485;
	sub.ftz.f32 	%f815, %f489, %f491;

BB9_142:
	ld.const.f32 	%f96, [polyPoints+148];
	setp.gt.ftz.f32	%p251, %f96, %f2;
	setp.le.ftz.f32	%p252, %f93, %f2;
	xor.pred  	%p253, %p252, %p251;
	@!%p253 bra 	BB9_144;
	bra.uni 	BB9_143;

BB9_143:
	mov.f32 	%f816, 0fBF800000;
	bra.uni 	BB9_145;

BB9_144:
	ld.const.f32 	%f493, [polyPoints+132];
	ld.const.f32 	%f494, [polyPoints+140];
	ld.const.f32 	%f495, [polyPoints+136];
	sub.ftz.f32 	%f496, %f2, %f495;
	mul.ftz.f32 	%f497, %f494, %f496;
	sub.ftz.f32 	%f498, %f1, %f493;
	sub.ftz.f32 	%f816, %f497, %f498;

BB9_145:
	ld.const.f32 	%f99, [polyPoints+160];
	setp.gt.ftz.f32	%p254, %f99, %f2;
	setp.le.ftz.f32	%p255, %f96, %f2;
	xor.pred  	%p256, %p255, %p254;
	@!%p256 bra 	BB9_147;
	bra.uni 	BB9_146;

BB9_146:
	mov.f32 	%f817, 0fBF800000;
	bra.uni 	BB9_148;

BB9_147:
	ld.const.f32 	%f500, [polyPoints+152];
	ld.const.v2.f32 	{%f501, %f502}, [polyPoints+144];
	sub.ftz.f32 	%f504, %f2, %f502;
	mul.ftz.f32 	%f505, %f500, %f504;
	sub.ftz.f32 	%f507, %f1, %f501;
	sub.ftz.f32 	%f817, %f505, %f507;

BB9_148:
	ld.const.f32 	%f102, [polyPoints+172];
	setp.gt.ftz.f32	%p257, %f102, %f2;
	setp.le.ftz.f32	%p258, %f99, %f2;
	xor.pred  	%p259, %p258, %p257;
	@!%p259 bra 	BB9_150;
	bra.uni 	BB9_149;

BB9_149:
	mov.f32 	%f818, 0fBF800000;
	bra.uni 	BB9_151;

BB9_150:
	ld.const.f32 	%f509, [polyPoints+156];
	ld.const.f32 	%f510, [polyPoints+164];
	ld.const.f32 	%f511, [polyPoints+160];
	sub.ftz.f32 	%f512, %f2, %f511;
	mul.ftz.f32 	%f513, %f510, %f512;
	sub.ftz.f32 	%f514, %f1, %f509;
	sub.ftz.f32 	%f818, %f513, %f514;

BB9_151:
	ld.const.f32 	%f105, [polyPoints+184];
	setp.gt.ftz.f32	%p260, %f105, %f2;
	setp.le.ftz.f32	%p261, %f102, %f2;
	xor.pred  	%p262, %p261, %p260;
	@!%p262 bra 	BB9_153;
	bra.uni 	BB9_152;

BB9_152:
	mov.f32 	%f819, 0fBF800000;
	bra.uni 	BB9_154;

BB9_153:
	ld.const.f32 	%f516, [polyPoints+176];
	ld.const.v2.f32 	{%f517, %f518}, [polyPoints+168];
	sub.ftz.f32 	%f520, %f2, %f518;
	mul.ftz.f32 	%f521, %f516, %f520;
	sub.ftz.f32 	%f523, %f1, %f517;
	sub.ftz.f32 	%f819, %f521, %f523;

BB9_154:
	ld.const.f32 	%f525, [polyPoints+196];
	setp.gt.ftz.f32	%p263, %f525, %f2;
	setp.le.ftz.f32	%p264, %f105, %f2;
	xor.pred  	%p265, %p264, %p263;
	@!%p265 bra 	BB9_156;
	bra.uni 	BB9_155;

BB9_155:
	mov.f32 	%f820, 0fBF800000;
	bra.uni 	BB9_157;

BB9_156:
	ld.const.f32 	%f526, [polyPoints+180];
	ld.const.f32 	%f527, [polyPoints+188];
	ld.const.f32 	%f528, [polyPoints+184];
	sub.ftz.f32 	%f529, %f2, %f528;
	mul.ftz.f32 	%f530, %f527, %f529;
	sub.ftz.f32 	%f531, %f1, %f526;
	sub.ftz.f32 	%f820, %f530, %f531;

BB9_157:
	cvta.to.global.u64 	%rd41, %rd34;
	shl.b64 	%rd42, %rd1, 4;
	add.s64 	%rd53, %rd41, %rd42;
	mov.u32 	%r253, 0;

BB9_158:
	mov.u32 	%r28, %r253;
	cvt.rn.f32.s32	%f110, %r28;
	setp.gt.ftz.f32	%p266, %f805, %f110;
	@%p266 bra 	BB9_160;

	mov.f32 	%f821, 0f47C35000;
	mov.u32 	%r254, 0;
	bra.uni 	BB9_161;

BB9_160:
	mov.f32 	%f534, 0f47C35000;
	min.ftz.f32 	%f821, %f534, %f805;
	mov.u32 	%r254, 1;

BB9_161:
	setp.leu.ftz.f32	%p267, %f806, %f110;
	@%p267 bra 	BB9_163;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f806;

BB9_163:
	setp.leu.ftz.f32	%p268, %f807, %f110;
	@%p268 bra 	BB9_165;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f807;

BB9_165:
	setp.leu.ftz.f32	%p269, %f808, %f110;
	@%p269 bra 	BB9_167;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f808;

BB9_167:
	setp.leu.ftz.f32	%p270, %f809, %f110;
	@%p270 bra 	BB9_169;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f809;

BB9_169:
	setp.leu.ftz.f32	%p271, %f810, %f110;
	@%p271 bra 	BB9_171;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f810;

BB9_171:
	setp.leu.ftz.f32	%p272, %f811, %f110;
	@%p272 bra 	BB9_173;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f811;

BB9_173:
	setp.leu.ftz.f32	%p273, %f812, %f110;
	@%p273 bra 	BB9_175;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f812;

BB9_175:
	setp.leu.ftz.f32	%p274, %f813, %f110;
	@%p274 bra 	BB9_177;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f813;

BB9_177:
	setp.leu.ftz.f32	%p275, %f814, %f110;
	@%p275 bra 	BB9_179;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f814;

BB9_179:
	setp.leu.ftz.f32	%p276, %f815, %f110;
	@%p276 bra 	BB9_181;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f815;

BB9_181:
	setp.leu.ftz.f32	%p277, %f816, %f110;
	@%p277 bra 	BB9_183;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f816;

BB9_183:
	setp.leu.ftz.f32	%p278, %f817, %f110;
	@%p278 bra 	BB9_185;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f817;

BB9_185:
	setp.leu.ftz.f32	%p279, %f818, %f110;
	@%p279 bra 	BB9_187;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f818;

BB9_187:
	setp.leu.ftz.f32	%p280, %f819, %f110;
	@%p280 bra 	BB9_189;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f819;

BB9_189:
	setp.leu.ftz.f32	%p281, %f820, %f110;
	@%p281 bra 	BB9_191;

	xor.b32  	%r254, %r254, 1;
	min.ftz.f32 	%f821, %f821, %f820;

BB9_191:
	add.s32 	%r253, %r28, 8;
	cvt.rn.f32.s32	%f535, %r253;
	setp.ltu.ftz.f32	%p282, %f821, %f535;
	add.s64 	%rd12, %rd53, 12;
	@%p282 bra 	BB9_194;

	setp.ne.s32	%p283, %r254, 0;
	@%p283 bra 	BB9_200;

	mov.u32 	%r208, 0;
	st.global.u32 	[%rd12], %r208;
	st.global.u32 	[%rd12+16], %r208;
	st.global.u32 	[%rd12+32], %r208;
	st.global.u32 	[%rd12+48], %r208;
	st.global.u32 	[%rd12+64], %r208;
	st.global.u32 	[%rd12+80], %r208;
	st.global.u32 	[%rd12+96], %r208;
	st.global.u32 	[%rd12+112], %r208;
	bra.uni 	BB9_200;

BB9_194:
	setp.eq.s32	%p284, %r254, 0;
	add.s64 	%rd54, %rd53, 28;
	add.s32 	%r255, %r28, 1;
	@%p284 bra 	BB9_195;
	bra.uni 	BB9_196;

BB9_195:
	mov.u32 	%r211, 0;
	st.global.u32 	[%rd12], %r211;
	add.s64 	%rd54, %rd53, 28;
	add.s32 	%r255, %r28, 1;

BB9_196:
	mov.u32 	%r256, 1;

BB9_197:
	cvt.rn.f32.s32	%f536, %r255;
	setp.gt.ftz.f32	%p285, %f805, %f536;
	setp.gt.ftz.f32	%p286, %f806, %f536;
	xor.pred  	%p287, %p286, %p285;
	setp.gt.ftz.f32	%p288, %f807, %f536;
	xor.pred  	%p289, %p288, %p287;
	setp.gt.ftz.f32	%p290, %f808, %f536;
	xor.pred  	%p291, %p290, %p289;
	setp.gt.ftz.f32	%p292, %f809, %f536;
	xor.pred  	%p293, %p292, %p291;
	setp.gt.ftz.f32	%p294, %f810, %f536;
	xor.pred  	%p295, %p294, %p293;
	setp.gt.ftz.f32	%p296, %f811, %f536;
	xor.pred  	%p297, %p296, %p295;
	setp.gt.ftz.f32	%p298, %f812, %f536;
	xor.pred  	%p299, %p298, %p297;
	setp.gt.ftz.f32	%p300, %f813, %f536;
	xor.pred  	%p301, %p300, %p299;
	setp.gt.ftz.f32	%p302, %f814, %f536;
	xor.pred  	%p303, %p302, %p301;
	setp.gt.ftz.f32	%p304, %f815, %f536;
	xor.pred  	%p305, %p304, %p303;
	setp.gt.ftz.f32	%p306, %f816, %f536;
	xor.pred  	%p307, %p306, %p305;
	setp.gt.ftz.f32	%p308, %f817, %f536;
	xor.pred  	%p309, %p308, %p307;
	setp.gt.ftz.f32	%p310, %f818, %f536;
	xor.pred  	%p311, %p310, %p309;
	setp.gt.ftz.f32	%p312, %f819, %f536;
	xor.pred  	%p313, %p312, %p311;
	setp.gt.ftz.f32	%p314, %f820, %f536;
	xor.pred  	%p315, %p314, %p313;
	@%p315 bra 	BB9_199;

	mov.u32 	%r212, 0;
	st.global.u32 	[%rd54], %r212;

BB9_199:
	add.s32 	%r256, %r256, 1;
	add.s64 	%rd54, %rd54, 16;
	add.s32 	%r255, %r255, 1;
	setp.lt.s32	%p316, %r256, 8;
	@%p316 bra 	BB9_197;

BB9_200:
	add.s64 	%rd53, %rd53, 128;
	setp.lt.s32	%p317, %r253, 32;
	@%p317 bra 	BB9_158;
	bra.uni 	BB9_400;

BB9_201:
	setp.eq.s32	%p318, %r134, 16;
	@%p318 bra 	BB9_308;

	setp.eq.s32	%p319, %r134, 8;
	@%p319 bra 	BB9_246;

	setp.ne.s32	%p320, %r134, 4;
	@%p320 bra 	BB9_400;

	ld.const.f32 	%f537, [polyPoints+4];
	setp.le.ftz.f32	%p321, %f537, %f2;
	ld.const.f32 	%f143, [polyPoints+16];
	setp.gt.ftz.f32	%p322, %f143, %f2;
	xor.pred  	%p323, %p321, %p322;
	@!%p323 bra 	BB9_206;
	bra.uni 	BB9_205;

BB9_205:
	mov.f32 	%f822, 0fBF800000;
	bra.uni 	BB9_207;

BB9_206:
	ld.const.f32 	%f538, [polyPoints+8];
	ld.const.v2.f32 	{%f539, %f540}, [polyPoints];
	sub.ftz.f32 	%f542, %f2, %f540;
	mul.ftz.f32 	%f543, %f538, %f542;
	sub.ftz.f32 	%f545, %f1, %f539;
	sub.ftz.f32 	%f822, %f543, %f545;

BB9_207:
	ld.const.f32 	%f146, [polyPoints+28];
	setp.gt.ftz.f32	%p324, %f146, %f2;
	setp.le.ftz.f32	%p325, %f143, %f2;
	xor.pred  	%p326, %p325, %p324;
	@!%p326 bra 	BB9_209;
	bra.uni 	BB9_208;

BB9_208:
	mov.f32 	%f823, 0fBF800000;
	bra.uni 	BB9_210;

BB9_209:
	ld.const.f32 	%f547, [polyPoints+12];
	ld.const.f32 	%f548, [polyPoints+20];
	ld.const.f32 	%f549, [polyPoints+16];
	sub.ftz.f32 	%f550, %f2, %f549;
	mul.ftz.f32 	%f551, %f548, %f550;
	sub.ftz.f32 	%f552, %f1, %f547;
	sub.ftz.f32 	%f823, %f551, %f552;

BB9_210:
	ld.const.f32 	%f149, [polyPoints+40];
	setp.gt.ftz.f32	%p327, %f149, %f2;
	setp.le.ftz.f32	%p328, %f146, %f2;
	xor.pred  	%p329, %p328, %p327;
	@!%p329 bra 	BB9_212;
	bra.uni 	BB9_211;

BB9_211:
	mov.f32 	%f824, 0fBF800000;
	bra.uni 	BB9_213;

BB9_212:
	ld.const.f32 	%f554, [polyPoints+32];
	ld.const.v2.f32 	{%f555, %f556}, [polyPoints+24];
	sub.ftz.f32 	%f558, %f2, %f556;
	mul.ftz.f32 	%f559, %f554, %f558;
	sub.ftz.f32 	%f561, %f1, %f555;
	sub.ftz.f32 	%f824, %f559, %f561;

BB9_213:
	ld.const.f32 	%f563, [polyPoints+52];
	setp.gt.ftz.f32	%p330, %f563, %f2;
	setp.le.ftz.f32	%p331, %f149, %f2;
	xor.pred  	%p332, %p331, %p330;
	@!%p332 bra 	BB9_215;
	bra.uni 	BB9_214;

BB9_214:
	mov.f32 	%f825, 0fBF800000;
	bra.uni 	BB9_216;

BB9_215:
	ld.const.f32 	%f564, [polyPoints+36];
	ld.const.f32 	%f565, [polyPoints+44];
	ld.const.f32 	%f566, [polyPoints+40];
	sub.ftz.f32 	%f567, %f2, %f566;
	mul.ftz.f32 	%f568, %f565, %f567;
	sub.ftz.f32 	%f569, %f1, %f564;
	sub.ftz.f32 	%f825, %f568, %f569;

BB9_216:
	mad.lo.s32 	%r218, %r133, %r145, %r1;
	cvta.to.global.u64 	%rd43, %rd34;
	mul.wide.s32 	%rd44, %r218, 8;
	add.s64 	%rd45, %rd44, %rd43;
	add.s64 	%rd55, %rd45, 38;
	mov.u32 	%r257, 0;

BB9_217:
	mov.u32 	%r67, %r257;
	cvt.rn.f32.s32	%f154, %r67;
	setp.gt.ftz.f32	%p333, %f822, %f154;
	@%p333 bra 	BB9_219;

	mov.f32 	%f826, 0f47C35000;
	mov.u32 	%r258, 0;
	bra.uni 	BB9_220;

BB9_219:
	mov.f32 	%f572, 0f47C35000;
	min.ftz.f32 	%f826, %f572, %f822;
	mov.u32 	%r258, 1;

BB9_220:
	setp.leu.ftz.f32	%p334, %f823, %f154;
	@%p334 bra 	BB9_222;

	xor.b32  	%r258, %r258, 1;
	min.ftz.f32 	%f826, %f826, %f823;

BB9_222:
	setp.leu.ftz.f32	%p335, %f824, %f154;
	@%p335 bra 	BB9_224;

	xor.b32  	%r258, %r258, 1;
	min.ftz.f32 	%f826, %f826, %f824;

BB9_224:
	setp.leu.ftz.f32	%p336, %f825, %f154;
	@%p336 bra 	BB9_226;

	xor.b32  	%r258, %r258, 1;
	min.ftz.f32 	%f826, %f826, %f825;

BB9_226:
	add.s32 	%r257, %r67, 8;
	cvt.rn.f32.s32	%f573, %r257;
	setp.ltu.ftz.f32	%p337, %f826, %f573;
	add.s64 	%rd20, %rd55, -32;
	@%p337 bra 	BB9_229;

	setp.ne.s32	%p338, %r258, 0;
	@%p338 bra 	BB9_245;

	mov.u16 	%rs1, 0;
	st.global.u16 	[%rd20], %rs1;
	st.global.u16 	[%rd20+8], %rs1;
	st.global.u16 	[%rd20+16], %rs1;
	st.global.u16 	[%rd20+24], %rs1;
	st.global.u16 	[%rd20+32], %rs1;
	st.global.u16 	[%rd20+40], %rs1;
	st.global.u16 	[%rd20+48], %rs1;
	st.global.u16 	[%rd20+56], %rs1;
	bra.uni 	BB9_245;

BB9_229:
	setp.ne.s32	%p339, %r258, 0;
	@%p339 bra 	BB9_231;

	mov.u16 	%rs2, 0;
	st.global.u16 	[%rd20], %rs2;

BB9_231:
	add.s32 	%r221, %r67, 1;
	cvt.rn.f32.s32	%f574, %r221;
	setp.gt.ftz.f32	%p340, %f822, %f574;
	setp.gt.ftz.f32	%p341, %f823, %f574;
	xor.pred  	%p342, %p341, %p340;
	setp.gt.ftz.f32	%p343, %f824, %f574;
	xor.pred  	%p344, %p343, %p342;
	setp.gt.ftz.f32	%p345, %f825, %f574;
	xor.pred  	%p346, %p345, %p344;
	@%p346 bra 	BB9_233;

	mov.u16 	%rs3, 0;
	st.global.u16 	[%rd20+8], %rs3;

BB9_233:
	add.s32 	%r222, %r67, 2;
	cvt.rn.f32.s32	%f575, %r222;
	setp.gt.ftz.f32	%p347, %f822, %f575;
	setp.gt.ftz.f32	%p348, %f823, %f575;
	xor.pred  	%p349, %p348, %p347;
	setp.gt.ftz.f32	%p350, %f824, %f575;
	xor.pred  	%p351, %p350, %p349;
	setp.gt.ftz.f32	%p352, %f825, %f575;
	xor.pred  	%p353, %p352, %p351;
	@%p353 bra 	BB9_235;

	mov.u16 	%rs4, 0;
	st.global.u16 	[%rd20+16], %rs4;

BB9_235:
	add.s32 	%r223, %r67, 3;
	cvt.rn.f32.s32	%f576, %r223;
	setp.gt.ftz.f32	%p354, %f822, %f576;
	setp.gt.ftz.f32	%p355, %f823, %f576;
	xor.pred  	%p356, %p355, %p354;
	setp.gt.ftz.f32	%p357, %f824, %f576;
	xor.pred  	%p358, %p357, %p356;
	setp.gt.ftz.f32	%p359, %f825, %f576;
	xor.pred  	%p360, %p359, %p358;
	@%p360 bra 	BB9_237;

	mov.u16 	%rs5, 0;
	st.global.u16 	[%rd20+24], %rs5;

BB9_237:
	add.s32 	%r224, %r67, 4;
	cvt.rn.f32.s32	%f577, %r224;
	setp.gt.ftz.f32	%p361, %f822, %f577;
	setp.gt.ftz.f32	%p362, %f823, %f577;
	xor.pred  	%p363, %p362, %p361;
	setp.gt.ftz.f32	%p364, %f824, %f577;
	xor.pred  	%p365, %p364, %p363;
	setp.gt.ftz.f32	%p366, %f825, %f577;
	xor.pred  	%p367, %p366, %p365;
	@%p367 bra 	BB9_239;

	mov.u16 	%rs6, 0;
	st.global.u16 	[%rd20+32], %rs6;

BB9_239:
	add.s32 	%r225, %r67, 5;
	cvt.rn.f32.s32	%f578, %r225;
	setp.gt.ftz.f32	%p368, %f822, %f578;
	setp.gt.ftz.f32	%p369, %f823, %f578;
	xor.pred  	%p370, %p369, %p368;
	setp.gt.ftz.f32	%p371, %f824, %f578;
	xor.pred  	%p372, %p371, %p370;
	setp.gt.ftz.f32	%p373, %f825, %f578;
	xor.pred  	%p374, %p373, %p372;
	@%p374 bra 	BB9_241;

	mov.u16 	%rs7, 0;
	st.global.u16 	[%rd20+40], %rs7;

BB9_241:
	add.s32 	%r226, %r67, 6;
	cvt.rn.f32.s32	%f579, %r226;
	setp.gt.ftz.f32	%p375, %f822, %f579;
	setp.gt.ftz.f32	%p376, %f823, %f579;
	xor.pred  	%p377, %p376, %p375;
	setp.gt.ftz.f32	%p378, %f824, %f579;
	xor.pred  	%p379, %p378, %p377;
	setp.gt.ftz.f32	%p380, %f825, %f579;
	xor.pred  	%p381, %p380, %p379;
	@%p381 bra 	BB9_243;

	mov.u16 	%rs8, 0;
	st.global.u16 	[%rd20+48], %rs8;

BB9_243:
	add.s32 	%r227, %r67, 7;
	cvt.rn.f32.s32	%f580, %r227;
	setp.gt.ftz.f32	%p382, %f822, %f580;
	setp.gt.ftz.f32	%p383, %f823, %f580;
	xor.pred  	%p384, %p383, %p382;
	setp.gt.ftz.f32	%p385, %f824, %f580;
	xor.pred  	%p386, %p385, %p384;
	setp.gt.ftz.f32	%p387, %f825, %f580;
	xor.pred  	%p388, %p387, %p386;
	@%p388 bra 	BB9_245;

	mov.u16 	%rs9, 0;
	st.global.u16 	[%rd20+56], %rs9;

BB9_245:
	add.s64 	%rd55, %rd55, 64;
	setp.lt.s32	%p389, %r257, 32;
	@%p389 bra 	BB9_217;
	bra.uni 	BB9_400;

BB9_246:
	ld.const.f32 	%f581, [polyPoints+4];
	setp.le.ftz.f32	%p390, %f581, %f2;
	ld.const.f32 	%f163, [polyPoints+16];
	setp.gt.ftz.f32	%p391, %f163, %f2;
	xor.pred  	%p392, %p390, %p391;
	@!%p392 bra 	BB9_248;
	bra.uni 	BB9_247;

BB9_247:
	mov.f32 	%f827, 0fBF800000;
	bra.uni 	BB9_249;

BB9_248:
	ld.const.f32 	%f582, [polyPoints+8];
	ld.const.v2.f32 	{%f583, %f584}, [polyPoints];
	sub.ftz.f32 	%f586, %f2, %f584;
	mul.ftz.f32 	%f587, %f582, %f586;
	sub.ftz.f32 	%f589, %f1, %f583;
	sub.ftz.f32 	%f827, %f587, %f589;

BB9_249:
	ld.const.f32 	%f166, [polyPoints+28];
	setp.gt.ftz.f32	%p393, %f166, %f2;
	setp.le.ftz.f32	%p394, %f163, %f2;
	xor.pred  	%p395, %p394, %p393;
	@!%p395 bra 	BB9_251;
	bra.uni 	BB9_250;

BB9_250:
	mov.f32 	%f828, 0fBF800000;
	bra.uni 	BB9_252;

BB9_251:
	ld.const.f32 	%f591, [polyPoints+12];
	ld.const.f32 	%f592, [polyPoints+20];
	ld.const.f32 	%f593, [polyPoints+16];
	sub.ftz.f32 	%f594, %f2, %f593;
	mul.ftz.f32 	%f595, %f592, %f594;
	sub.ftz.f32 	%f596, %f1, %f591;
	sub.ftz.f32 	%f828, %f595, %f596;

BB9_252:
	ld.const.f32 	%f169, [polyPoints+40];
	setp.gt.ftz.f32	%p396, %f169, %f2;
	setp.le.ftz.f32	%p397, %f166, %f2;
	xor.pred  	%p398, %p397, %p396;
	@!%p398 bra 	BB9_254;
	bra.uni 	BB9_253;

BB9_253:
	mov.f32 	%f829, 0fBF800000;
	bra.uni 	BB9_255;

BB9_254:
	ld.const.f32 	%f598, [polyPoints+32];
	ld.const.v2.f32 	{%f599, %f600}, [polyPoints+24];
	sub.ftz.f32 	%f602, %f2, %f600;
	mul.ftz.f32 	%f603, %f598, %f602;
	sub.ftz.f32 	%f605, %f1, %f599;
	sub.ftz.f32 	%f829, %f603, %f605;

BB9_255:
	ld.const.f32 	%f172, [polyPoints+52];
	setp.gt.ftz.f32	%p399, %f172, %f2;
	setp.le.ftz.f32	%p400, %f169, %f2;
	xor.pred  	%p401, %p400, %p399;
	@!%p401 bra 	BB9_257;
	bra.uni 	BB9_256;

BB9_256:
	mov.f32 	%f830, 0fBF800000;
	bra.uni 	BB9_258;

BB9_257:
	ld.const.f32 	%f607, [polyPoints+36];
	ld.const.f32 	%f608, [polyPoints+44];
	ld.const.f32 	%f609, [polyPoints+40];
	sub.ftz.f32 	%f610, %f2, %f609;
	mul.ftz.f32 	%f611, %f608, %f610;
	sub.ftz.f32 	%f612, %f1, %f607;
	sub.ftz.f32 	%f830, %f611, %f612;

BB9_258:
	ld.const.f32 	%f175, [polyPoints+64];
	setp.gt.ftz.f32	%p402, %f175, %f2;
	setp.le.ftz.f32	%p403, %f172, %f2;
	xor.pred  	%p404, %p403, %p402;
	@!%p404 bra 	BB9_260;
	bra.uni 	BB9_259;

BB9_259:
	mov.f32 	%f831, 0fBF800000;
	bra.uni 	BB9_261;

BB9_260:
	ld.const.f32 	%f614, [polyPoints+56];
	ld.const.v2.f32 	{%f615, %f616}, [polyPoints+48];
	sub.ftz.f32 	%f618, %f2, %f616;
	mul.ftz.f32 	%f619, %f614, %f618;
	sub.ftz.f32 	%f621, %f1, %f615;
	sub.ftz.f32 	%f831, %f619, %f621;

BB9_261:
	ld.const.f32 	%f178, [polyPoints+76];
	setp.gt.ftz.f32	%p405, %f178, %f2;
	setp.le.ftz.f32	%p406, %f175, %f2;
	xor.pred  	%p407, %p406, %p405;
	@!%p407 bra 	BB9_263;
	bra.uni 	BB9_262;

BB9_262:
	mov.f32 	%f832, 0fBF800000;
	bra.uni 	BB9_264;

BB9_263:
	ld.const.f32 	%f623, [polyPoints+60];
	ld.const.f32 	%f624, [polyPoints+68];
	ld.const.f32 	%f625, [polyPoints+64];
	sub.ftz.f32 	%f626, %f2, %f625;
	mul.ftz.f32 	%f627, %f624, %f626;
	sub.ftz.f32 	%f628, %f1, %f623;
	sub.ftz.f32 	%f832, %f627, %f628;

BB9_264:
	ld.const.f32 	%f181, [polyPoints+88];
	setp.gt.ftz.f32	%p408, %f181, %f2;
	setp.le.ftz.f32	%p409, %f178, %f2;
	xor.pred  	%p410, %p409, %p408;
	@!%p410 bra 	BB9_266;
	bra.uni 	BB9_265;

BB9_265:
	mov.f32 	%f833, 0fBF800000;
	bra.uni 	BB9_267;

BB9_266:
	ld.const.f32 	%f630, [polyPoints+80];
	ld.const.v2.f32 	{%f631, %f632}, [polyPoints+72];
	sub.ftz.f32 	%f634, %f2, %f632;
	mul.ftz.f32 	%f635, %f630, %f634;
	sub.ftz.f32 	%f637, %f1, %f631;
	sub.ftz.f32 	%f833, %f635, %f637;

BB9_267:
	ld.const.f32 	%f639, [polyPoints+100];
	setp.gt.ftz.f32	%p411, %f639, %f2;
	setp.le.ftz.f32	%p412, %f181, %f2;
	xor.pred  	%p413, %p412, %p411;
	@!%p413 bra 	BB9_269;
	bra.uni 	BB9_268;

BB9_268:
	mov.f32 	%f834, 0fBF800000;
	bra.uni 	BB9_270;

BB9_269:
	ld.const.f32 	%f640, [polyPoints+84];
	ld.const.f32 	%f641, [polyPoints+92];
	ld.const.f32 	%f642, [polyPoints+88];
	sub.ftz.f32 	%f643, %f2, %f642;
	mul.ftz.f32 	%f644, %f641, %f643;
	sub.ftz.f32 	%f645, %f1, %f640;
	sub.ftz.f32 	%f834, %f644, %f645;

BB9_270:
	mad.lo.s32 	%r233, %r133, %r145, %r1;
	cvta.to.global.u64 	%rd46, %rd34;
	mul.wide.s32 	%rd47, %r233, 8;
	add.s64 	%rd48, %rd47, %rd46;
	add.s64 	%rd56, %rd48, 38;
	mov.u32 	%r259, 0;

BB9_271:
	mov.u32 	%r76, %r259;
	cvt.rn.f32.s32	%f186, %r76;
	setp.gt.ftz.f32	%p414, %f827, %f186;
	@%p414 bra 	BB9_273;

	mov.u32 	%r260, 0;
	mov.f32 	%f835, 0f47C35000;
	bra.uni 	BB9_274;

BB9_273:
	mov.f32 	%f648, 0f47C35000;
	min.ftz.f32 	%f835, %f648, %f827;
	mov.u32 	%r260, 1;

BB9_274:
	setp.leu.ftz.f32	%p415, %f828, %f186;
	@%p415 bra 	BB9_276;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f828;

BB9_276:
	setp.leu.ftz.f32	%p416, %f829, %f186;
	@%p416 bra 	BB9_278;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f829;

BB9_278:
	setp.leu.ftz.f32	%p417, %f830, %f186;
	@%p417 bra 	BB9_280;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f830;

BB9_280:
	setp.leu.ftz.f32	%p418, %f831, %f186;
	@%p418 bra 	BB9_282;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f831;

BB9_282:
	setp.leu.ftz.f32	%p419, %f832, %f186;
	@%p419 bra 	BB9_284;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f832;

BB9_284:
	setp.leu.ftz.f32	%p420, %f833, %f186;
	@%p420 bra 	BB9_286;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f833;

BB9_286:
	setp.leu.ftz.f32	%p421, %f834, %f186;
	@%p421 bra 	BB9_288;

	xor.b32  	%r260, %r260, 1;
	min.ftz.f32 	%f835, %f835, %f834;

BB9_288:
	add.s32 	%r259, %r76, 8;
	cvt.rn.f32.s32	%f649, %r259;
	setp.ltu.ftz.f32	%p422, %f835, %f649;
	add.s64 	%rd24, %rd56, -32;
	@%p422 bra 	BB9_291;

	setp.ne.s32	%p423, %r260, 0;
	@%p423 bra 	BB9_307;

	mov.u16 	%rs10, 0;
	st.global.u16 	[%rd24], %rs10;
	st.global.u16 	[%rd24+8], %rs10;
	st.global.u16 	[%rd24+16], %rs10;
	st.global.u16 	[%rd24+24], %rs10;
	st.global.u16 	[%rd24+32], %rs10;
	st.global.u16 	[%rd24+40], %rs10;
	st.global.u16 	[%rd24+48], %rs10;
	st.global.u16 	[%rd24+56], %rs10;
	bra.uni 	BB9_307;

BB9_291:
	setp.ne.s32	%p424, %r260, 0;
	@%p424 bra 	BB9_293;

	mov.u16 	%rs11, 0;
	st.global.u16 	[%rd24], %rs11;

BB9_293:
	add.s32 	%r236, %r76, 1;
	cvt.rn.f32.s32	%f650, %r236;
	setp.gt.ftz.f32	%p425, %f827, %f650;
	setp.gt.ftz.f32	%p426, %f828, %f650;
	xor.pred  	%p427, %p426, %p425;
	setp.gt.ftz.f32	%p428, %f829, %f650;
	xor.pred  	%p429, %p428, %p427;
	setp.gt.ftz.f32	%p430, %f830, %f650;
	xor.pred  	%p431, %p430, %p429;
	setp.gt.ftz.f32	%p432, %f831, %f650;
	xor.pred  	%p433, %p432, %p431;
	setp.gt.ftz.f32	%p434, %f832, %f650;
	xor.pred  	%p435, %p434, %p433;
	setp.gt.ftz.f32	%p436, %f833, %f650;
	xor.pred  	%p437, %p436, %p435;
	setp.gt.ftz.f32	%p438, %f834, %f650;
	xor.pred  	%p439, %p438, %p437;
	@%p439 bra 	BB9_295;

	mov.u16 	%rs12, 0;
	st.global.u16 	[%rd24+8], %rs12;

BB9_295:
	add.s32 	%r237, %r76, 2;
	cvt.rn.f32.s32	%f651, %r237;
	setp.gt.ftz.f32	%p440, %f827, %f651;
	setp.gt.ftz.f32	%p441, %f828, %f651;
	xor.pred  	%p442, %p441, %p440;
	setp.gt.ftz.f32	%p443, %f829, %f651;
	xor.pred  	%p444, %p443, %p442;
	setp.gt.ftz.f32	%p445, %f830, %f651;
	xor.pred  	%p446, %p445, %p444;
	setp.gt.ftz.f32	%p447, %f831, %f651;
	xor.pred  	%p448, %p447, %p446;
	setp.gt.ftz.f32	%p449, %f832, %f651;
	xor.pred  	%p450, %p449, %p448;
	setp.gt.ftz.f32	%p451, %f833, %f651;
	xor.pred  	%p452, %p451, %p450;
	setp.gt.ftz.f32	%p453, %f834, %f651;
	xor.pred  	%p454, %p453, %p452;
	@%p454 bra 	BB9_297;

	mov.u16 	%rs13, 0;
	st.global.u16 	[%rd24+16], %rs13;

BB9_297:
	add.s32 	%r238, %r76, 3;
	cvt.rn.f32.s32	%f652, %r238;
	setp.gt.ftz.f32	%p455, %f827, %f652;
	setp.gt.ftz.f32	%p456, %f828, %f652;
	xor.pred  	%p457, %p456, %p455;
	setp.gt.ftz.f32	%p458, %f829, %f652;
	xor.pred  	%p459, %p458, %p457;
	setp.gt.ftz.f32	%p460, %f830, %f652;
	xor.pred  	%p461, %p460, %p459;
	setp.gt.ftz.f32	%p462, %f831, %f652;
	xor.pred  	%p463, %p462, %p461;
	setp.gt.ftz.f32	%p464, %f832, %f652;
	xor.pred  	%p465, %p464, %p463;
	setp.gt.ftz.f32	%p466, %f833, %f652;
	xor.pred  	%p467, %p466, %p465;
	setp.gt.ftz.f32	%p468, %f834, %f652;
	xor.pred  	%p469, %p468, %p467;
	@%p469 bra 	BB9_299;

	mov.u16 	%rs14, 0;
	st.global.u16 	[%rd24+24], %rs14;

BB9_299:
	add.s32 	%r239, %r76, 4;
	cvt.rn.f32.s32	%f653, %r239;
	setp.gt.ftz.f32	%p470, %f827, %f653;
	setp.gt.ftz.f32	%p471, %f828, %f653;
	xor.pred  	%p472, %p471, %p470;
	setp.gt.ftz.f32	%p473, %f829, %f653;
	xor.pred  	%p474, %p473, %p472;
	setp.gt.ftz.f32	%p475, %f830, %f653;
	xor.pred  	%p476, %p475, %p474;
	setp.gt.ftz.f32	%p477, %f831, %f653;
	xor.pred  	%p478, %p477, %p476;
	setp.gt.ftz.f32	%p479, %f832, %f653;
	xor.pred  	%p480, %p479, %p478;
	setp.gt.ftz.f32	%p481, %f833, %f653;
	xor.pred  	%p482, %p481, %p480;
	setp.gt.ftz.f32	%p483, %f834, %f653;
	xor.pred  	%p484, %p483, %p482;
	@%p484 bra 	BB9_301;

	mov.u16 	%rs15, 0;
	st.global.u16 	[%rd24+32], %rs15;

BB9_301:
	add.s32 	%r240, %r76, 5;
	cvt.rn.f32.s32	%f654, %r240;
	setp.gt.ftz.f32	%p485, %f827, %f654;
	setp.gt.ftz.f32	%p486, %f828, %f654;
	xor.pred  	%p487, %p486, %p485;
	setp.gt.ftz.f32	%p488, %f829, %f654;
	xor.pred  	%p489, %p488, %p487;
	setp.gt.ftz.f32	%p490, %f830, %f654;
	xor.pred  	%p491, %p490, %p489;
	setp.gt.ftz.f32	%p492, %f831, %f654;
	xor.pred  	%p493, %p492, %p491;
	setp.gt.ftz.f32	%p494, %f832, %f654;
	xor.pred  	%p495, %p494, %p493;
	setp.gt.ftz.f32	%p496, %f833, %f654;
	xor.pred  	%p497, %p496, %p495;
	setp.gt.ftz.f32	%p498, %f834, %f654;
	xor.pred  	%p499, %p498, %p497;
	@%p499 bra 	BB9_303;

	mov.u16 	%rs16, 0;
	st.global.u16 	[%rd24+40], %rs16;

BB9_303:
	add.s32 	%r241, %r76, 6;
	cvt.rn.f32.s32	%f655, %r241;
	setp.gt.ftz.f32	%p500, %f827, %f655;
	setp.gt.ftz.f32	%p501, %f828, %f655;
	xor.pred  	%p502, %p501, %p500;
	setp.gt.ftz.f32	%p503, %f829, %f655;
	xor.pred  	%p504, %p503, %p502;
	setp.gt.ftz.f32	%p505, %f830, %f655;
	xor.pred  	%p506, %p505, %p504;
	setp.gt.ftz.f32	%p507, %f831, %f655;
	xor.pred  	%p508, %p507, %p506;
	setp.gt.ftz.f32	%p509, %f832, %f655;
	xor.pred  	%p510, %p509, %p508;
	setp.gt.ftz.f32	%p511, %f833, %f655;
	xor.pred  	%p512, %p511, %p510;
	setp.gt.ftz.f32	%p513, %f834, %f655;
	xor.pred  	%p514, %p513, %p512;
	@%p514 bra 	BB9_305;

	mov.u16 	%rs17, 0;
	st.global.u16 	[%rd24+48], %rs17;

BB9_305:
	add.s32 	%r242, %r76, 7;
	cvt.rn.f32.s32	%f656, %r242;
	setp.gt.ftz.f32	%p515, %f827, %f656;
	setp.gt.ftz.f32	%p516, %f828, %f656;
	xor.pred  	%p517, %p516, %p515;
	setp.gt.ftz.f32	%p518, %f829, %f656;
	xor.pred  	%p519, %p518, %p517;
	setp.gt.ftz.f32	%p520, %f830, %f656;
	xor.pred  	%p521, %p520, %p519;
	setp.gt.ftz.f32	%p522, %f831, %f656;
	xor.pred  	%p523, %p522, %p521;
	setp.gt.ftz.f32	%p524, %f832, %f656;
	xor.pred  	%p525, %p524, %p523;
	setp.gt.ftz.f32	%p526, %f833, %f656;
	xor.pred  	%p527, %p526, %p525;
	setp.gt.ftz.f32	%p528, %f834, %f656;
	xor.pred  	%p529, %p528, %p527;
	@%p529 bra 	BB9_307;

	mov.u16 	%rs18, 0;
	st.global.u16 	[%rd24+56], %rs18;

BB9_307:
	add.s64 	%rd56, %rd56, 64;
	setp.lt.s32	%p530, %r259, 32;
	@%p530 bra 	BB9_271;
	bra.uni 	BB9_400;

BB9_308:
	ld.const.f32 	%f657, [polyPoints+4];
	setp.le.ftz.f32	%p531, %f657, %f2;
	ld.const.f32 	%f203, [polyPoints+16];
	setp.gt.ftz.f32	%p532, %f203, %f2;
	xor.pred  	%p533, %p531, %p532;
	@!%p533 bra 	BB9_310;
	bra.uni 	BB9_309;

BB9_309:
	mov.f32 	%f836, 0fBF800000;
	bra.uni 	BB9_311;

BB9_310:
	ld.const.f32 	%f658, [polyPoints+8];
	ld.const.v2.f32 	{%f659, %f660}, [polyPoints];
	sub.ftz.f32 	%f662, %f2, %f660;
	mul.ftz.f32 	%f663, %f658, %f662;
	sub.ftz.f32 	%f665, %f1, %f659;
	sub.ftz.f32 	%f836, %f663, %f665;

BB9_311:
	ld.const.f32 	%f206, [polyPoints+28];
	setp.gt.ftz.f32	%p534, %f206, %f2;
	setp.le.ftz.f32	%p535, %f203, %f2;
	xor.pred  	%p536, %p535, %p534;
	@!%p536 bra 	BB9_313;
	bra.uni 	BB9_312;

BB9_312:
	mov.f32 	%f837, 0fBF800000;
	bra.uni 	BB9_314;

BB9_313:
	ld.const.f32 	%f667, [polyPoints+12];
	ld.const.f32 	%f668, [polyPoints+20];
	ld.const.f32 	%f669, [polyPoints+16];
	sub.ftz.f32 	%f670, %f2, %f669;
	mul.ftz.f32 	%f671, %f668, %f670;
	sub.ftz.f32 	%f672, %f1, %f667;
	sub.ftz.f32 	%f837, %f671, %f672;

BB9_314:
	ld.const.f32 	%f209, [polyPoints+40];
	setp.gt.ftz.f32	%p537, %f209, %f2;
	setp.le.ftz.f32	%p538, %f206, %f2;
	xor.pred  	%p539, %p538, %p537;
	@!%p539 bra 	BB9_316;
	bra.uni 	BB9_315;

BB9_315:
	mov.f32 	%f838, 0fBF800000;
	bra.uni 	BB9_317;

BB9_316:
	ld.const.f32 	%f674, [polyPoints+32];
	ld.const.v2.f32 	{%f675, %f676}, [polyPoints+24];
	sub.ftz.f32 	%f678, %f2, %f676;
	mul.ftz.f32 	%f679, %f674, %f678;
	sub.ftz.f32 	%f681, %f1, %f675;
	sub.ftz.f32 	%f838, %f679, %f681;

BB9_317:
	ld.const.f32 	%f212, [polyPoints+52];
	setp.gt.ftz.f32	%p540, %f212, %f2;
	setp.le.ftz.f32	%p541, %f209, %f2;
	xor.pred  	%p542, %p541, %p540;
	@!%p542 bra 	BB9_319;
	bra.uni 	BB9_318;

BB9_318:
	mov.f32 	%f839, 0fBF800000;
	bra.uni 	BB9_320;

BB9_319:
	ld.const.f32 	%f683, [polyPoints+36];
	ld.const.f32 	%f684, [polyPoints+44];
	ld.const.f32 	%f685, [polyPoints+40];
	sub.ftz.f32 	%f686, %f2, %f685;
	mul.ftz.f32 	%f687, %f684, %f686;
	sub.ftz.f32 	%f688, %f1, %f683;
	sub.ftz.f32 	%f839, %f687, %f688;

BB9_320:
	ld.const.f32 	%f215, [polyPoints+64];
	setp.gt.ftz.f32	%p543, %f215, %f2;
	setp.le.ftz.f32	%p544, %f212, %f2;
	xor.pred  	%p545, %p544, %p543;
	@!%p545 bra 	BB9_322;
	bra.uni 	BB9_321;

BB9_321:
	mov.f32 	%f840, 0fBF800000;
	bra.uni 	BB9_323;

BB9_322:
	ld.const.f32 	%f690, [polyPoints+56];
	ld.const.v2.f32 	{%f691, %f692}, [polyPoints+48];
	sub.ftz.f32 	%f694, %f2, %f692;
	mul.ftz.f32 	%f695, %f690, %f694;
	sub.ftz.f32 	%f697, %f1, %f691;
	sub.ftz.f32 	%f840, %f695, %f697;

BB9_323:
	ld.const.f32 	%f218, [polyPoints+76];
	setp.gt.ftz.f32	%p546, %f218, %f2;
	setp.le.ftz.f32	%p547, %f215, %f2;
	xor.pred  	%p548, %p547, %p546;
	@!%p548 bra 	BB9_325;
	bra.uni 	BB9_324;

BB9_324:
	mov.f32 	%f841, 0fBF800000;
	bra.uni 	BB9_326;

BB9_325:
	ld.const.f32 	%f699, [polyPoints+60];
	ld.const.f32 	%f700, [polyPoints+68];
	ld.const.f32 	%f701, [polyPoints+64];
	sub.ftz.f32 	%f702, %f2, %f701;
	mul.ftz.f32 	%f703, %f700, %f702;
	sub.ftz.f32 	%f704, %f1, %f699;
	sub.ftz.f32 	%f841, %f703, %f704;

BB9_326:
	ld.const.f32 	%f221, [polyPoints+88];
	setp.gt.ftz.f32	%p549, %f221, %f2;
	setp.le.ftz.f32	%p550, %f218, %f2;
	xor.pred  	%p551, %p550, %p549;
	@!%p551 bra 	BB9_328;
	bra.uni 	BB9_327;

BB9_327:
	mov.f32 	%f842, 0fBF800000;
	bra.uni 	BB9_329;

BB9_328:
	ld.const.f32 	%f706, [polyPoints+80];
	ld.const.v2.f32 	{%f707, %f708}, [polyPoints+72];
	sub.ftz.f32 	%f710, %f2, %f708;
	mul.ftz.f32 	%f711, %f706, %f710;
	sub.ftz.f32 	%f713, %f1, %f707;
	sub.ftz.f32 	%f842, %f711, %f713;

BB9_329:
	ld.const.f32 	%f224, [polyPoints+100];
	setp.gt.ftz.f32	%p552, %f224, %f2;
	setp.le.ftz.f32	%p553, %f221, %f2;
	xor.pred  	%p554, %p553, %p552;
	@!%p554 bra 	BB9_331;
	bra.uni 	BB9_330;

BB9_330:
	mov.f32 	%f843, 0fBF800000;
	bra.uni 	BB9_332;

BB9_331:
	ld.const.f32 	%f715, [polyPoints+84];
	ld.const.f32 	%f716, [polyPoints+92];
	ld.const.f32 	%f717, [polyPoints+88];
	sub.ftz.f32 	%f718, %f2, %f717;
	mul.ftz.f32 	%f719, %f716, %f718;
	sub.ftz.f32 	%f720, %f1, %f715;
	sub.ftz.f32 	%f843, %f719, %f720;

BB9_332:
	ld.const.f32 	%f227, [polyPoints+112];
	setp.gt.ftz.f32	%p555, %f227, %f2;
	setp.le.ftz.f32	%p556, %f224, %f2;
	xor.pred  	%p557, %p556, %p555;
	@!%p557 bra 	BB9_334;
	bra.uni 	BB9_333;

BB9_333:
	mov.f32 	%f844, 0fBF800000;
	bra.uni 	BB9_335;

BB9_334:
	ld.const.f32 	%f722, [polyPoints+104];
	ld.const.v2.f32 	{%f723, %f724}, [polyPoints+96];
	sub.ftz.f32 	%f726, %f2, %f724;
	mul.ftz.f32 	%f727, %f722, %f726;
	sub.ftz.f32 	%f729, %f1, %f723;
	sub.ftz.f32 	%f844, %f727, %f729;

BB9_335:
	ld.const.f32 	%f230, [polyPoints+124];
	setp.gt.ftz.f32	%p558, %f230, %f2;
	setp.le.ftz.f32	%p559, %f227, %f2;
	xor.pred  	%p560, %p559, %p558;
	@!%p560 bra 	BB9_337;
	bra.uni 	BB9_336;

BB9_336:
	mov.f32 	%f845, 0fBF800000;
	bra.uni 	BB9_338;

BB9_337:
	ld.const.f32 	%f731, [polyPoints+108];
	ld.const.f32 	%f732, [polyPoints+116];
	ld.const.f32 	%f733, [polyPoints+112];
	sub.ftz.f32 	%f734, %f2, %f733;
	mul.ftz.f32 	%f735, %f732, %f734;
	sub.ftz.f32 	%f736, %f1, %f731;
	sub.ftz.f32 	%f845, %f735, %f736;

BB9_338:
	ld.const.f32 	%f233, [polyPoints+136];
	setp.gt.ftz.f32	%p561, %f233, %f2;
	setp.le.ftz.f32	%p562, %f230, %f2;
	xor.pred  	%p563, %p562, %p561;
	@!%p563 bra 	BB9_340;
	bra.uni 	BB9_339;

BB9_339:
	mov.f32 	%f846, 0fBF800000;
	bra.uni 	BB9_341;

BB9_340:
	ld.const.f32 	%f738, [polyPoints+128];
	ld.const.v2.f32 	{%f739, %f740}, [polyPoints+120];
	sub.ftz.f32 	%f742, %f2, %f740;
	mul.ftz.f32 	%f743, %f738, %f742;
	sub.ftz.f32 	%f745, %f1, %f739;
	sub.ftz.f32 	%f846, %f743, %f745;

BB9_341:
	ld.const.f32 	%f236, [polyPoints+148];
	setp.gt.ftz.f32	%p564, %f236, %f2;
	setp.le.ftz.f32	%p565, %f233, %f2;
	xor.pred  	%p566, %p565, %p564;
	@!%p566 bra 	BB9_343;
	bra.uni 	BB9_342;

BB9_342:
	mov.f32 	%f847, 0fBF800000;
	bra.uni 	BB9_344;

BB9_343:
	ld.const.f32 	%f747, [polyPoints+132];
	ld.const.f32 	%f748, [polyPoints+140];
	ld.const.f32 	%f749, [polyPoints+136];
	sub.ftz.f32 	%f750, %f2, %f749;
	mul.ftz.f32 	%f751, %f748, %f750;
	sub.ftz.f32 	%f752, %f1, %f747;
	sub.ftz.f32 	%f847, %f751, %f752;

BB9_344:
	ld.const.f32 	%f239, [polyPoints+160];
	setp.gt.ftz.f32	%p567, %f239, %f2;
	setp.le.ftz.f32	%p568, %f236, %f2;
	xor.pred  	%p569, %p568, %p567;
	@!%p569 bra 	BB9_346;
	bra.uni 	BB9_345;

BB9_345:
	mov.f32 	%f848, 0fBF800000;
	bra.uni 	BB9_347;

BB9_346:
	ld.const.f32 	%f754, [polyPoints+152];
	ld.const.v2.f32 	{%f755, %f756}, [polyPoints+144];
	sub.ftz.f32 	%f758, %f2, %f756;
	mul.ftz.f32 	%f759, %f754, %f758;
	sub.ftz.f32 	%f761, %f1, %f755;
	sub.ftz.f32 	%f848, %f759, %f761;

BB9_347:
	ld.const.f32 	%f242, [polyPoints+172];
	setp.gt.ftz.f32	%p570, %f242, %f2;
	setp.le.ftz.f32	%p571, %f239, %f2;
	xor.pred  	%p572, %p571, %p570;
	@!%p572 bra 	BB9_349;
	bra.uni 	BB9_348;

BB9_348:
	mov.f32 	%f849, 0fBF800000;
	bra.uni 	BB9_350;

BB9_349:
	ld.const.f32 	%f763, [polyPoints+156];
	ld.const.f32 	%f764, [polyPoints+164];
	ld.const.f32 	%f765, [polyPoints+160];
	sub.ftz.f32 	%f766, %f2, %f765;
	mul.ftz.f32 	%f767, %f764, %f766;
	sub.ftz.f32 	%f768, %f1, %f763;
	sub.ftz.f32 	%f849, %f767, %f768;

BB9_350:
	ld.const.f32 	%f245, [polyPoints+184];
	setp.gt.ftz.f32	%p573, %f245, %f2;
	setp.le.ftz.f32	%p574, %f242, %f2;
	xor.pred  	%p575, %p574, %p573;
	@!%p575 bra 	BB9_352;
	bra.uni 	BB9_351;

BB9_351:
	mov.f32 	%f850, 0fBF800000;
	bra.uni 	BB9_353;

BB9_352:
	ld.const.f32 	%f770, [polyPoints+176];
	ld.const.v2.f32 	{%f771, %f772}, [polyPoints+168];
	sub.ftz.f32 	%f774, %f2, %f772;
	mul.ftz.f32 	%f775, %f770, %f774;
	sub.ftz.f32 	%f777, %f1, %f771;
	sub.ftz.f32 	%f850, %f775, %f777;

BB9_353:
	ld.const.f32 	%f779, [polyPoints+196];
	setp.gt.ftz.f32	%p576, %f779, %f2;
	setp.le.ftz.f32	%p577, %f245, %f2;
	xor.pred  	%p578, %p577, %p576;
	@!%p578 bra 	BB9_355;
	bra.uni 	BB9_354;

BB9_354:
	mov.f32 	%f851, 0fBF800000;
	bra.uni 	BB9_356;

BB9_355:
	ld.const.f32 	%f780, [polyPoints+180];
	ld.const.f32 	%f781, [polyPoints+188];
	ld.const.f32 	%f782, [polyPoints+184];
	sub.ftz.f32 	%f783, %f2, %f782;
	mul.ftz.f32 	%f784, %f781, %f783;
	sub.ftz.f32 	%f785, %f1, %f780;
	sub.ftz.f32 	%f851, %f784, %f785;

BB9_356:
	cvta.to.global.u64 	%rd49, %rd34;
	shl.b64 	%rd50, %rd1, 3;
	add.s64 	%rd57, %rd49, %rd50;
	mov.u32 	%r261, 0;

BB9_357:
	mov.u32 	%r93, %r261;
	cvt.rn.f32.s32	%f250, %r93;
	setp.gt.ftz.f32	%p579, %f836, %f250;
	@%p579 bra 	BB9_359;

	mov.u32 	%r262, 0;
	mov.f32 	%f852, 0f47C35000;
	bra.uni 	BB9_360;

BB9_359:
	mov.f32 	%f788, 0f47C35000;
	min.ftz.f32 	%f852, %f788, %f836;
	mov.u32 	%r262, 1;

BB9_360:
	setp.leu.ftz.f32	%p580, %f837, %f250;
	@%p580 bra 	BB9_362;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f837;

BB9_362:
	setp.leu.ftz.f32	%p581, %f838, %f250;
	@%p581 bra 	BB9_364;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f838;

BB9_364:
	setp.leu.ftz.f32	%p582, %f839, %f250;
	@%p582 bra 	BB9_366;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f839;

BB9_366:
	setp.leu.ftz.f32	%p583, %f840, %f250;
	@%p583 bra 	BB9_368;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f840;

BB9_368:
	setp.leu.ftz.f32	%p584, %f841, %f250;
	@%p584 bra 	BB9_370;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f841;

BB9_370:
	setp.leu.ftz.f32	%p585, %f842, %f250;
	@%p585 bra 	BB9_372;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f842;

BB9_372:
	setp.leu.ftz.f32	%p586, %f843, %f250;
	@%p586 bra 	BB9_374;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f843;

BB9_374:
	setp.leu.ftz.f32	%p587, %f844, %f250;
	@%p587 bra 	BB9_376;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f844;

BB9_376:
	setp.leu.ftz.f32	%p588, %f845, %f250;
	@%p588 bra 	BB9_378;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f845;

BB9_378:
	setp.leu.ftz.f32	%p589, %f846, %f250;
	@%p589 bra 	BB9_380;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f846;

BB9_380:
	setp.leu.ftz.f32	%p590, %f847, %f250;
	@%p590 bra 	BB9_382;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f847;

BB9_382:
	setp.leu.ftz.f32	%p591, %f848, %f250;
	@%p591 bra 	BB9_384;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f848;

BB9_384:
	setp.leu.ftz.f32	%p592, %f849, %f250;
	@%p592 bra 	BB9_386;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f849;

BB9_386:
	setp.leu.ftz.f32	%p593, %f850, %f250;
	@%p593 bra 	BB9_388;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f850;

BB9_388:
	setp.leu.ftz.f32	%p594, %f851, %f250;
	@%p594 bra 	BB9_390;

	xor.b32  	%r262, %r262, 1;
	min.ftz.f32 	%f852, %f852, %f851;

BB9_390:
	add.s32 	%r261, %r93, 8;
	cvt.rn.f32.s32	%f789, %r261;
	setp.ltu.ftz.f32	%p595, %f852, %f789;
	add.s64 	%rd28, %rd57, 6;
	@%p595 bra 	BB9_393;

	setp.ne.s32	%p596, %r262, 0;
	@%p596 bra 	BB9_399;

	mov.u16 	%rs19, 0;
	st.global.u16 	[%rd28], %rs19;
	st.global.u16 	[%rd28+8], %rs19;
	st.global.u16 	[%rd28+16], %rs19;
	st.global.u16 	[%rd28+24], %rs19;
	st.global.u16 	[%rd28+32], %rs19;
	st.global.u16 	[%rd28+40], %rs19;
	st.global.u16 	[%rd28+48], %rs19;
	st.global.u16 	[%rd28+56], %rs19;
	bra.uni 	BB9_399;

BB9_393:
	setp.eq.s32	%p597, %r262, 0;
	add.s64 	%rd58, %rd57, 14;
	add.s32 	%r263, %r93, 1;
	@%p597 bra 	BB9_394;
	bra.uni 	BB9_395;

BB9_394:
	add.s64 	%rd58, %rd57, 14;
	mov.u16 	%rs20, 0;
	st.global.u16 	[%rd28], %rs20;
	add.s32 	%r263, %r93, 1;

BB9_395:
	mov.u32 	%r264, 1;

BB9_396:
	cvt.rn.f32.s32	%f790, %r263;
	setp.gt.ftz.f32	%p598, %f836, %f790;
	setp.gt.ftz.f32	%p599, %f837, %f790;
	xor.pred  	%p600, %p599, %p598;
	setp.gt.ftz.f32	%p601, %f838, %f790;
	xor.pred  	%p602, %p601, %p600;
	setp.gt.ftz.f32	%p603, %f839, %f790;
	xor.pred  	%p604, %p603, %p602;
	setp.gt.ftz.f32	%p605, %f840, %f790;
	xor.pred  	%p606, %p605, %p604;
	setp.gt.ftz.f32	%p607, %f841, %f790;
	xor.pred  	%p608, %p607, %p606;
	setp.gt.ftz.f32	%p609, %f842, %f790;
	xor.pred  	%p610, %p609, %p608;
	setp.gt.ftz.f32	%p611, %f843, %f790;
	xor.pred  	%p612, %p611, %p610;
	setp.gt.ftz.f32	%p613, %f844, %f790;
	xor.pred  	%p614, %p613, %p612;
	setp.gt.ftz.f32	%p615, %f845, %f790;
	xor.pred  	%p616, %p615, %p614;
	setp.gt.ftz.f32	%p617, %f846, %f790;
	xor.pred  	%p618, %p617, %p616;
	setp.gt.ftz.f32	%p619, %f847, %f790;
	xor.pred  	%p620, %p619, %p618;
	setp.gt.ftz.f32	%p621, %f848, %f790;
	xor.pred  	%p622, %p621, %p620;
	setp.gt.ftz.f32	%p623, %f849, %f790;
	xor.pred  	%p624, %p623, %p622;
	setp.gt.ftz.f32	%p625, %f850, %f790;
	xor.pred  	%p626, %p625, %p624;
	setp.gt.ftz.f32	%p627, %f851, %f790;
	xor.pred  	%p628, %p627, %p626;
	@%p628 bra 	BB9_398;

	mov.u16 	%rs21, 0;
	st.global.u16 	[%rd58], %rs21;

BB9_398:
	add.s32 	%r264, %r264, 1;
	add.s64 	%rd58, %rd58, 8;
	add.s32 	%r263, %r263, 1;
	setp.lt.s32	%p629, %r264, 8;
	@%p629 bra 	BB9_396;

BB9_399:
	add.s64 	%rd57, %rd57, 64;
	setp.lt.s32	%p630, %r261, 32;
	@%p630 bra 	BB9_357;

BB9_400:
	ret;
}


