//
// Generated by NVIDIA NVVM Compiler
// Compiler built on Wed Jul 10 12:41:20 2013 (1373485280)
// Cuda compilation tools, release 5.5, V5.5.0
//

.version 3.2
.target sm_30
.address_size 64

	.file	1 "D:/singlebarrel/releases/2014.03/shared/adobe/Iridas/IRIDASLIB/GPU/fxKuwaharaFilter7x7.cu", 1399785249, 12732
	.file	2 "d:\\singlebarrel\\releases\\2014.03\\shared\\adobe\\mediacore\\external\\3rdparty\\nvidia\\cuda\\win\\include\\device_functions.h", 1399785281, 191626
.global .texref texture0_RECT;
.global .align 1 .b8 $str[11] = {95, 95, 67, 85, 68, 65, 95, 70, 84, 90, 0};

.visible .entry ShaderKernel_fxKuwaharaFilter7x7(
	.param .u64 ShaderKernel_fxKuwaharaFilter7x7_param_0,
	.param .u32 ShaderKernel_fxKuwaharaFilter7x7_param_1,
	.param .u32 ShaderKernel_fxKuwaharaFilter7x7_param_2,
	.param .u32 ShaderKernel_fxKuwaharaFilter7x7_param_3,
	.param .u32 ShaderKernel_fxKuwaharaFilter7x7_param_4,
	.param .u64 ShaderKernel_fxKuwaharaFilter7x7_param_5,
	.param .u64 ShaderKernel_fxKuwaharaFilter7x7_param_6
)
{
	.reg .pred 	%p<8>;
	.reg .s16 	%rs<5>;
	.reg .s32 	%r<14>;
	.reg .f32 	%f<1011>;
	.reg .s64 	%rd<135>;


	ld.param.u64 	%rd2, [ShaderKernel_fxKuwaharaFilter7x7_param_0];
	ld.param.u32 	%r4, [ShaderKernel_fxKuwaharaFilter7x7_param_1];
	ld.param.u32 	%r5, [ShaderKernel_fxKuwaharaFilter7x7_param_2];
	ld.param.u32 	%r6, [ShaderKernel_fxKuwaharaFilter7x7_param_3];
	ld.param.u32 	%r7, [ShaderKernel_fxKuwaharaFilter7x7_param_4];
	cvta.to.global.u64 	%rd1, %rd2;
	.loc 1 24 1
	mov.u32 	%r8, %ntid.x;
	mov.u32 	%r9, %ctaid.x;
	mov.u32 	%r10, %tid.x;
	mad.lo.s32 	%r1, %r8, %r9, %r10;
	mov.u32 	%r11, %ntid.y;
	mov.u32 	%r12, %ctaid.y;
	mov.u32 	%r13, %tid.y;
	mad.lo.s32 	%r2, %r11, %r12, %r13;
	.loc 1 24 1
	setp.lt.s32	%p1, %r1, %r6;
	setp.lt.s32	%p2, %r2, %r7;
	and.pred  	%p3, %p1, %p2;
	.loc 1 24 1
	@!%p3 bra 	BB0_4;
	bra.uni 	BB0_1;

BB0_1:
	.loc 1 24 1
	cvt.rn.f32.s32	%f393, %r1;
	add.ftz.f32 	%f394, %f393, 0f3F000000;
	cvt.rn.f32.s32	%f395, %r2;
	add.ftz.f32 	%f396, %f395, 0f3F000000;
	.loc 1 24 1
	add.ftz.f32 	%f373, %f394, 0fC0400000;
	add.ftz.f32 	%f128, %f396, 0f40400000;
	add.ftz.f32 	%f379, %f394, 0fC0000000;
	.loc 1 24 1
	add.ftz.f32 	%f385, %f394, 0fBF800000;
	add.ftz.f32 	%f391, %f394, 0f00000000;
	.loc 1 24 1
	add.ftz.f32 	%f152, %f396, 0f40000000;
	.loc 1 24 1
	add.ftz.f32 	%f176, %f396, 0f3F800000;
	mov.f32 	%f397, 0f3F800000;
	.loc 1 24 1
	add.ftz.f32 	%f320, %f396, 0f00000000;
	.loc 1 24 111
	// inline asm
	tex.2d.v4.f32.f32 {%f9, %f10, %f11, %f12}, [texture0_RECT, {%f373, %f128}];
	// inline asm
	.loc 1 24 113
	// inline asm
	tex.2d.v4.f32.f32 {%f15, %f16, %f17, %f18}, [texture0_RECT, {%f379, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f21, %f22, %f23, %f24}, [texture0_RECT, {%f385, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f27, %f28, %f29, %f30}, [texture0_RECT, {%f391, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f33, %f34, %f35, %f36}, [texture0_RECT, {%f373, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f39, %f40, %f41, %f42}, [texture0_RECT, {%f379, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f45, %f46, %f47, %f48}, [texture0_RECT, {%f385, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f51, %f52, %f53, %f54}, [texture0_RECT, {%f391, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f57, %f58, %f59, %f60}, [texture0_RECT, {%f373, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f63, %f64, %f65, %f66}, [texture0_RECT, {%f379, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f69, %f70, %f71, %f72}, [texture0_RECT, {%f385, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f75, %f76, %f77, %f78}, [texture0_RECT, {%f391, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f81, %f82, %f83, %f84}, [texture0_RECT, {%f373, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f87, %f88, %f89, %f90}, [texture0_RECT, {%f379, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f93, %f94, %f95, %f96}, [texture0_RECT, {%f385, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f99, %f100, %f101, %f102}, [texture0_RECT, {%f391, %f320}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f398, %f11, %f17;
	add.ftz.f32 	%f399, %f10, %f16;
	add.ftz.f32 	%f400, %f9, %f15;
	.loc 1 24 1
	add.ftz.f32 	%f401, %f398, %f23;
	add.ftz.f32 	%f402, %f399, %f22;
	add.ftz.f32 	%f403, %f400, %f21;
	.loc 1 24 1
	add.ftz.f32 	%f404, %f401, %f29;
	add.ftz.f32 	%f405, %f402, %f28;
	add.ftz.f32 	%f406, %f403, %f27;
	.loc 1 24 1
	add.ftz.f32 	%f407, %f404, %f35;
	add.ftz.f32 	%f408, %f405, %f34;
	add.ftz.f32 	%f409, %f406, %f33;
	.loc 1 24 1
	add.ftz.f32 	%f410, %f407, %f41;
	add.ftz.f32 	%f411, %f408, %f40;
	add.ftz.f32 	%f412, %f409, %f39;
	.loc 1 24 1
	add.ftz.f32 	%f413, %f410, %f47;
	add.ftz.f32 	%f414, %f411, %f46;
	add.ftz.f32 	%f415, %f412, %f45;
	.loc 1 24 1
	add.ftz.f32 	%f416, %f413, %f53;
	add.ftz.f32 	%f417, %f414, %f52;
	add.ftz.f32 	%f418, %f415, %f51;
	.loc 1 24 1
	add.ftz.f32 	%f419, %f416, %f59;
	add.ftz.f32 	%f420, %f417, %f58;
	add.ftz.f32 	%f421, %f418, %f57;
	.loc 1 24 1
	add.ftz.f32 	%f422, %f419, %f65;
	add.ftz.f32 	%f423, %f420, %f64;
	add.ftz.f32 	%f424, %f421, %f63;
	.loc 1 24 1
	add.ftz.f32 	%f425, %f422, %f71;
	add.ftz.f32 	%f426, %f423, %f70;
	add.ftz.f32 	%f427, %f424, %f69;
	.loc 1 24 1
	add.ftz.f32 	%f428, %f425, %f77;
	add.ftz.f32 	%f429, %f426, %f76;
	add.ftz.f32 	%f430, %f427, %f75;
	.loc 1 24 1
	add.ftz.f32 	%f431, %f428, %f83;
	add.ftz.f32 	%f432, %f429, %f82;
	add.ftz.f32 	%f433, %f430, %f81;
	.loc 1 24 1
	add.ftz.f32 	%f434, %f431, %f89;
	add.ftz.f32 	%f435, %f432, %f88;
	add.ftz.f32 	%f436, %f433, %f87;
	.loc 1 24 1
	add.ftz.f32 	%f437, %f434, %f95;
	add.ftz.f32 	%f438, %f435, %f94;
	add.ftz.f32 	%f439, %f436, %f93;
	.loc 1 24 1
	add.ftz.f32 	%f440, %f437, %f101;
	add.ftz.f32 	%f441, %f438, %f100;
	add.ftz.f32 	%f442, %f439, %f99;
	.loc 1 24 1
	mul.ftz.f32 	%f443, %f440, 0f3D800000;
	mul.ftz.f32 	%f444, %f441, 0f3D800000;
	mul.ftz.f32 	%f445, %f442, 0f3D800000;
	.loc 1 24 1
	sub.ftz.f32 	%f446, %f443, %f11;
	sub.ftz.f32 	%f447, %f444, %f10;
	sub.ftz.f32 	%f448, %f445, %f9;
	.loc 1 24 1
	mul.ftz.f32 	%f449, %f446, %f446;
	mul.ftz.f32 	%f450, %f447, %f447;
	mul.ftz.f32 	%f451, %f448, %f448;
	.loc 1 24 1
	sub.ftz.f32 	%f452, %f443, %f17;
	sub.ftz.f32 	%f453, %f444, %f16;
	sub.ftz.f32 	%f454, %f445, %f15;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f455, %f452, %f452, %f449;
	fma.rn.ftz.f32 	%f456, %f453, %f453, %f450;
	fma.rn.ftz.f32 	%f457, %f454, %f454, %f451;
	.loc 1 24 1
	sub.ftz.f32 	%f458, %f443, %f23;
	sub.ftz.f32 	%f459, %f444, %f22;
	sub.ftz.f32 	%f460, %f445, %f21;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f461, %f458, %f458, %f455;
	fma.rn.ftz.f32 	%f462, %f459, %f459, %f456;
	fma.rn.ftz.f32 	%f463, %f460, %f460, %f457;
	.loc 1 24 1
	sub.ftz.f32 	%f464, %f443, %f29;
	sub.ftz.f32 	%f465, %f444, %f28;
	sub.ftz.f32 	%f466, %f445, %f27;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f467, %f464, %f464, %f461;
	fma.rn.ftz.f32 	%f468, %f465, %f465, %f462;
	fma.rn.ftz.f32 	%f469, %f466, %f466, %f463;
	.loc 1 24 1
	sub.ftz.f32 	%f470, %f443, %f35;
	sub.ftz.f32 	%f471, %f444, %f34;
	sub.ftz.f32 	%f472, %f445, %f33;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f473, %f470, %f470, %f467;
	fma.rn.ftz.f32 	%f474, %f471, %f471, %f468;
	fma.rn.ftz.f32 	%f475, %f472, %f472, %f469;
	.loc 1 24 1
	sub.ftz.f32 	%f476, %f443, %f41;
	sub.ftz.f32 	%f477, %f444, %f40;
	sub.ftz.f32 	%f478, %f445, %f39;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f479, %f476, %f476, %f473;
	fma.rn.ftz.f32 	%f480, %f477, %f477, %f474;
	fma.rn.ftz.f32 	%f481, %f478, %f478, %f475;
	.loc 1 24 1
	sub.ftz.f32 	%f482, %f443, %f47;
	sub.ftz.f32 	%f483, %f444, %f46;
	sub.ftz.f32 	%f484, %f445, %f45;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f485, %f482, %f482, %f479;
	fma.rn.ftz.f32 	%f486, %f483, %f483, %f480;
	fma.rn.ftz.f32 	%f487, %f484, %f484, %f481;
	.loc 1 24 1
	sub.ftz.f32 	%f488, %f443, %f53;
	sub.ftz.f32 	%f489, %f444, %f52;
	sub.ftz.f32 	%f490, %f445, %f51;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f491, %f488, %f488, %f485;
	fma.rn.ftz.f32 	%f492, %f489, %f489, %f486;
	fma.rn.ftz.f32 	%f493, %f490, %f490, %f487;
	.loc 1 24 1
	sub.ftz.f32 	%f494, %f443, %f59;
	sub.ftz.f32 	%f495, %f444, %f58;
	sub.ftz.f32 	%f496, %f445, %f57;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f497, %f494, %f494, %f491;
	fma.rn.ftz.f32 	%f498, %f495, %f495, %f492;
	fma.rn.ftz.f32 	%f499, %f496, %f496, %f493;
	.loc 1 24 1
	sub.ftz.f32 	%f500, %f443, %f65;
	sub.ftz.f32 	%f501, %f444, %f64;
	sub.ftz.f32 	%f502, %f445, %f63;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f503, %f500, %f500, %f497;
	fma.rn.ftz.f32 	%f504, %f501, %f501, %f498;
	fma.rn.ftz.f32 	%f505, %f502, %f502, %f499;
	.loc 1 24 1
	sub.ftz.f32 	%f506, %f443, %f71;
	sub.ftz.f32 	%f507, %f444, %f70;
	sub.ftz.f32 	%f508, %f445, %f69;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f509, %f506, %f506, %f503;
	fma.rn.ftz.f32 	%f510, %f507, %f507, %f504;
	fma.rn.ftz.f32 	%f511, %f508, %f508, %f505;
	.loc 1 24 1
	sub.ftz.f32 	%f512, %f443, %f77;
	sub.ftz.f32 	%f513, %f444, %f76;
	sub.ftz.f32 	%f514, %f445, %f75;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f515, %f512, %f512, %f509;
	fma.rn.ftz.f32 	%f516, %f513, %f513, %f510;
	fma.rn.ftz.f32 	%f517, %f514, %f514, %f511;
	.loc 1 24 1
	sub.ftz.f32 	%f518, %f443, %f83;
	sub.ftz.f32 	%f519, %f444, %f82;
	sub.ftz.f32 	%f520, %f445, %f81;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f521, %f518, %f518, %f515;
	fma.rn.ftz.f32 	%f522, %f519, %f519, %f516;
	fma.rn.ftz.f32 	%f523, %f520, %f520, %f517;
	.loc 1 24 1
	sub.ftz.f32 	%f524, %f443, %f89;
	sub.ftz.f32 	%f525, %f444, %f88;
	sub.ftz.f32 	%f526, %f445, %f87;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f527, %f524, %f524, %f521;
	fma.rn.ftz.f32 	%f528, %f525, %f525, %f522;
	fma.rn.ftz.f32 	%f529, %f526, %f526, %f523;
	.loc 1 24 1
	sub.ftz.f32 	%f530, %f443, %f95;
	sub.ftz.f32 	%f531, %f444, %f94;
	sub.ftz.f32 	%f532, %f445, %f93;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f533, %f530, %f530, %f527;
	fma.rn.ftz.f32 	%f534, %f531, %f531, %f528;
	fma.rn.ftz.f32 	%f535, %f532, %f532, %f529;
	.loc 1 24 1
	sub.ftz.f32 	%f536, %f443, %f101;
	sub.ftz.f32 	%f537, %f444, %f100;
	sub.ftz.f32 	%f538, %f445, %f99;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f539, %f536, %f536, %f533;
	fma.rn.ftz.f32 	%f540, %f537, %f537, %f534;
	fma.rn.ftz.f32 	%f541, %f538, %f538, %f535;
	.loc 1 24 1
	mul.ftz.f32 	%f542, %f540, 0f3D800000;
	fma.rn.ftz.f32 	%f543, %f539, 0f3D800000, %f542;
	fma.rn.ftz.f32 	%f544, %f541, 0f3D800000, %f543;
	.loc 1 24 1
	add.ftz.f32 	%f283, %f394, 0f3F800000;
	.loc 1 24 1
	add.ftz.f32 	%f289, %f394, 0f40000000;
	add.ftz.f32 	%f295, %f394, 0f40400000;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f105, %f106, %f107, %f108}, [texture0_RECT, {%f391, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f111, %f112, %f113, %f114}, [texture0_RECT, {%f283, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f117, %f118, %f119, %f120}, [texture0_RECT, {%f289, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f123, %f124, %f125, %f126}, [texture0_RECT, {%f295, %f128}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f129, %f130, %f131, %f132}, [texture0_RECT, {%f391, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f135, %f136, %f137, %f138}, [texture0_RECT, {%f283, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f141, %f142, %f143, %f144}, [texture0_RECT, {%f289, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f147, %f148, %f149, %f150}, [texture0_RECT, {%f295, %f152}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f153, %f154, %f155, %f156}, [texture0_RECT, {%f391, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f159, %f160, %f161, %f162}, [texture0_RECT, {%f283, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f165, %f166, %f167, %f168}, [texture0_RECT, {%f289, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f171, %f172, %f173, %f174}, [texture0_RECT, {%f295, %f176}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f177, %f178, %f179, %f180}, [texture0_RECT, {%f391, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f183, %f184, %f185, %f186}, [texture0_RECT, {%f283, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f189, %f190, %f191, %f192}, [texture0_RECT, {%f289, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f195, %f196, %f197, %f198}, [texture0_RECT, {%f295, %f320}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f545, %f107, %f113;
	add.ftz.f32 	%f546, %f106, %f112;
	add.ftz.f32 	%f547, %f105, %f111;
	.loc 1 24 1
	add.ftz.f32 	%f548, %f545, %f119;
	add.ftz.f32 	%f549, %f546, %f118;
	add.ftz.f32 	%f550, %f547, %f117;
	.loc 1 24 1
	add.ftz.f32 	%f551, %f548, %f125;
	add.ftz.f32 	%f552, %f549, %f124;
	add.ftz.f32 	%f553, %f550, %f123;
	.loc 1 24 1
	add.ftz.f32 	%f554, %f551, %f131;
	add.ftz.f32 	%f555, %f552, %f130;
	add.ftz.f32 	%f556, %f553, %f129;
	.loc 1 24 1
	add.ftz.f32 	%f557, %f554, %f137;
	add.ftz.f32 	%f558, %f555, %f136;
	add.ftz.f32 	%f559, %f556, %f135;
	.loc 1 24 1
	add.ftz.f32 	%f560, %f557, %f143;
	add.ftz.f32 	%f561, %f558, %f142;
	add.ftz.f32 	%f562, %f559, %f141;
	.loc 1 24 1
	add.ftz.f32 	%f563, %f560, %f149;
	add.ftz.f32 	%f564, %f561, %f148;
	add.ftz.f32 	%f565, %f562, %f147;
	.loc 1 24 1
	add.ftz.f32 	%f566, %f563, %f155;
	add.ftz.f32 	%f567, %f564, %f154;
	add.ftz.f32 	%f568, %f565, %f153;
	.loc 1 24 1
	add.ftz.f32 	%f569, %f566, %f161;
	add.ftz.f32 	%f570, %f567, %f160;
	add.ftz.f32 	%f571, %f568, %f159;
	.loc 1 24 1
	add.ftz.f32 	%f572, %f569, %f167;
	add.ftz.f32 	%f573, %f570, %f166;
	add.ftz.f32 	%f574, %f571, %f165;
	.loc 1 24 1
	add.ftz.f32 	%f575, %f572, %f173;
	add.ftz.f32 	%f576, %f573, %f172;
	add.ftz.f32 	%f577, %f574, %f171;
	.loc 1 24 1
	add.ftz.f32 	%f578, %f575, %f179;
	add.ftz.f32 	%f579, %f576, %f178;
	add.ftz.f32 	%f580, %f577, %f177;
	.loc 1 24 1
	add.ftz.f32 	%f581, %f578, %f185;
	add.ftz.f32 	%f582, %f579, %f184;
	add.ftz.f32 	%f583, %f580, %f183;
	.loc 1 24 1
	add.ftz.f32 	%f584, %f581, %f191;
	add.ftz.f32 	%f585, %f582, %f190;
	add.ftz.f32 	%f586, %f583, %f189;
	.loc 1 24 1
	add.ftz.f32 	%f587, %f584, %f197;
	add.ftz.f32 	%f588, %f585, %f196;
	add.ftz.f32 	%f589, %f586, %f195;
	.loc 1 24 1
	mul.ftz.f32 	%f590, %f587, 0f3D800000;
	mul.ftz.f32 	%f591, %f588, 0f3D800000;
	mul.ftz.f32 	%f592, %f589, 0f3D800000;
	.loc 1 24 1
	sub.ftz.f32 	%f593, %f590, %f107;
	sub.ftz.f32 	%f594, %f591, %f106;
	sub.ftz.f32 	%f595, %f592, %f105;
	.loc 1 24 1
	mul.ftz.f32 	%f596, %f593, %f593;
	mul.ftz.f32 	%f597, %f594, %f594;
	mul.ftz.f32 	%f598, %f595, %f595;
	.loc 1 24 1
	sub.ftz.f32 	%f599, %f590, %f113;
	sub.ftz.f32 	%f600, %f591, %f112;
	sub.ftz.f32 	%f601, %f592, %f111;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f602, %f599, %f599, %f596;
	fma.rn.ftz.f32 	%f603, %f600, %f600, %f597;
	fma.rn.ftz.f32 	%f604, %f601, %f601, %f598;
	.loc 1 24 1
	sub.ftz.f32 	%f605, %f590, %f119;
	sub.ftz.f32 	%f606, %f591, %f118;
	sub.ftz.f32 	%f607, %f592, %f117;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f608, %f605, %f605, %f602;
	fma.rn.ftz.f32 	%f609, %f606, %f606, %f603;
	fma.rn.ftz.f32 	%f610, %f607, %f607, %f604;
	.loc 1 24 1
	sub.ftz.f32 	%f611, %f590, %f125;
	sub.ftz.f32 	%f612, %f591, %f124;
	sub.ftz.f32 	%f613, %f592, %f123;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f614, %f611, %f611, %f608;
	fma.rn.ftz.f32 	%f615, %f612, %f612, %f609;
	fma.rn.ftz.f32 	%f616, %f613, %f613, %f610;
	.loc 1 24 1
	sub.ftz.f32 	%f617, %f590, %f131;
	sub.ftz.f32 	%f618, %f591, %f130;
	sub.ftz.f32 	%f619, %f592, %f129;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f620, %f617, %f617, %f614;
	fma.rn.ftz.f32 	%f621, %f618, %f618, %f615;
	fma.rn.ftz.f32 	%f622, %f619, %f619, %f616;
	.loc 1 24 1
	sub.ftz.f32 	%f623, %f590, %f137;
	sub.ftz.f32 	%f624, %f591, %f136;
	sub.ftz.f32 	%f625, %f592, %f135;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f626, %f623, %f623, %f620;
	fma.rn.ftz.f32 	%f627, %f624, %f624, %f621;
	fma.rn.ftz.f32 	%f628, %f625, %f625, %f622;
	.loc 1 24 1
	sub.ftz.f32 	%f629, %f590, %f143;
	sub.ftz.f32 	%f630, %f591, %f142;
	sub.ftz.f32 	%f631, %f592, %f141;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f632, %f629, %f629, %f626;
	fma.rn.ftz.f32 	%f633, %f630, %f630, %f627;
	fma.rn.ftz.f32 	%f634, %f631, %f631, %f628;
	.loc 1 24 1
	sub.ftz.f32 	%f635, %f590, %f149;
	sub.ftz.f32 	%f636, %f591, %f148;
	sub.ftz.f32 	%f637, %f592, %f147;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f638, %f635, %f635, %f632;
	fma.rn.ftz.f32 	%f639, %f636, %f636, %f633;
	fma.rn.ftz.f32 	%f640, %f637, %f637, %f634;
	.loc 1 24 1
	sub.ftz.f32 	%f641, %f590, %f155;
	sub.ftz.f32 	%f642, %f591, %f154;
	sub.ftz.f32 	%f643, %f592, %f153;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f644, %f641, %f641, %f638;
	fma.rn.ftz.f32 	%f645, %f642, %f642, %f639;
	fma.rn.ftz.f32 	%f646, %f643, %f643, %f640;
	.loc 1 24 1
	sub.ftz.f32 	%f647, %f590, %f161;
	sub.ftz.f32 	%f648, %f591, %f160;
	sub.ftz.f32 	%f649, %f592, %f159;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f650, %f647, %f647, %f644;
	fma.rn.ftz.f32 	%f651, %f648, %f648, %f645;
	fma.rn.ftz.f32 	%f652, %f649, %f649, %f646;
	.loc 1 24 1
	sub.ftz.f32 	%f653, %f590, %f167;
	sub.ftz.f32 	%f654, %f591, %f166;
	sub.ftz.f32 	%f655, %f592, %f165;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f656, %f653, %f653, %f650;
	fma.rn.ftz.f32 	%f657, %f654, %f654, %f651;
	fma.rn.ftz.f32 	%f658, %f655, %f655, %f652;
	.loc 1 24 1
	sub.ftz.f32 	%f659, %f590, %f173;
	sub.ftz.f32 	%f660, %f591, %f172;
	sub.ftz.f32 	%f661, %f592, %f171;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f662, %f659, %f659, %f656;
	fma.rn.ftz.f32 	%f663, %f660, %f660, %f657;
	fma.rn.ftz.f32 	%f664, %f661, %f661, %f658;
	.loc 1 24 1
	sub.ftz.f32 	%f665, %f590, %f179;
	sub.ftz.f32 	%f666, %f591, %f178;
	sub.ftz.f32 	%f667, %f592, %f177;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f668, %f665, %f665, %f662;
	fma.rn.ftz.f32 	%f669, %f666, %f666, %f663;
	fma.rn.ftz.f32 	%f670, %f667, %f667, %f664;
	.loc 1 24 1
	sub.ftz.f32 	%f671, %f590, %f185;
	sub.ftz.f32 	%f672, %f591, %f184;
	sub.ftz.f32 	%f673, %f592, %f183;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f674, %f671, %f671, %f668;
	fma.rn.ftz.f32 	%f675, %f672, %f672, %f669;
	fma.rn.ftz.f32 	%f676, %f673, %f673, %f670;
	.loc 1 24 1
	sub.ftz.f32 	%f677, %f590, %f191;
	sub.ftz.f32 	%f678, %f591, %f190;
	sub.ftz.f32 	%f679, %f592, %f189;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f680, %f677, %f677, %f674;
	fma.rn.ftz.f32 	%f681, %f678, %f678, %f675;
	fma.rn.ftz.f32 	%f682, %f679, %f679, %f676;
	.loc 1 24 1
	sub.ftz.f32 	%f683, %f590, %f197;
	sub.ftz.f32 	%f684, %f591, %f196;
	sub.ftz.f32 	%f685, %f592, %f195;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f686, %f683, %f683, %f680;
	fma.rn.ftz.f32 	%f687, %f684, %f684, %f681;
	fma.rn.ftz.f32 	%f688, %f685, %f685, %f682;
	.loc 1 24 1
	mul.ftz.f32 	%f689, %f687, 0f3D800000;
	fma.rn.ftz.f32 	%f690, %f686, 0f3D800000, %f689;
	fma.rn.ftz.f32 	%f691, %f688, 0f3D800000, %f690;
	.loc 1 24 1
	add.ftz.f32 	%f344, %f396, 0fBF800000;
	.loc 1 24 1
	add.ftz.f32 	%f368, %f396, 0fC0000000;
	.loc 1 24 1
	add.ftz.f32 	%f392, %f396, 0fC0400000;
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f201, %f202, %f203, %f204}, [texture0_RECT, {%f391, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f207, %f208, %f209, %f210}, [texture0_RECT, {%f283, %f320}];
	// inline asm
	.loc 1 24 119
	// inline asm
	tex.2d.v4.f32.f32 {%f213, %f214, %f215, %f216}, [texture0_RECT, {%f289, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f219, %f220, %f221, %f222}, [texture0_RECT, {%f295, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f225, %f226, %f227, %f228}, [texture0_RECT, {%f391, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f231, %f232, %f233, %f234}, [texture0_RECT, {%f283, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f237, %f238, %f239, %f240}, [texture0_RECT, {%f289, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f243, %f244, %f245, %f246}, [texture0_RECT, {%f295, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f249, %f250, %f251, %f252}, [texture0_RECT, {%f391, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f255, %f256, %f257, %f258}, [texture0_RECT, {%f283, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f261, %f262, %f263, %f264}, [texture0_RECT, {%f289, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f267, %f268, %f269, %f270}, [texture0_RECT, {%f295, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f273, %f274, %f275, %f276}, [texture0_RECT, {%f391, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f279, %f280, %f281, %f282}, [texture0_RECT, {%f283, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f285, %f286, %f287, %f288}, [texture0_RECT, {%f289, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f291, %f292, %f293, %f294}, [texture0_RECT, {%f295, %f392}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f692, %f203, %f209;
	add.ftz.f32 	%f693, %f202, %f208;
	add.ftz.f32 	%f694, %f201, %f207;
	.loc 1 24 1
	add.ftz.f32 	%f695, %f692, %f215;
	add.ftz.f32 	%f696, %f693, %f214;
	add.ftz.f32 	%f697, %f694, %f213;
	.loc 1 24 1
	add.ftz.f32 	%f698, %f695, %f221;
	add.ftz.f32 	%f699, %f696, %f220;
	add.ftz.f32 	%f700, %f697, %f219;
	.loc 1 24 1
	add.ftz.f32 	%f701, %f698, %f227;
	add.ftz.f32 	%f702, %f699, %f226;
	add.ftz.f32 	%f703, %f700, %f225;
	.loc 1 24 1
	add.ftz.f32 	%f704, %f701, %f233;
	add.ftz.f32 	%f705, %f702, %f232;
	add.ftz.f32 	%f706, %f703, %f231;
	.loc 1 24 1
	add.ftz.f32 	%f707, %f704, %f239;
	add.ftz.f32 	%f708, %f705, %f238;
	add.ftz.f32 	%f709, %f706, %f237;
	.loc 1 24 1
	add.ftz.f32 	%f710, %f707, %f245;
	add.ftz.f32 	%f711, %f708, %f244;
	add.ftz.f32 	%f712, %f709, %f243;
	.loc 1 24 1
	add.ftz.f32 	%f713, %f710, %f251;
	add.ftz.f32 	%f714, %f711, %f250;
	add.ftz.f32 	%f715, %f712, %f249;
	.loc 1 24 1
	add.ftz.f32 	%f716, %f713, %f257;
	add.ftz.f32 	%f717, %f714, %f256;
	add.ftz.f32 	%f718, %f715, %f255;
	.loc 1 24 1
	add.ftz.f32 	%f719, %f716, %f263;
	add.ftz.f32 	%f720, %f717, %f262;
	add.ftz.f32 	%f721, %f718, %f261;
	.loc 1 24 1
	add.ftz.f32 	%f722, %f719, %f269;
	add.ftz.f32 	%f723, %f720, %f268;
	add.ftz.f32 	%f724, %f721, %f267;
	.loc 1 24 1
	add.ftz.f32 	%f725, %f722, %f275;
	add.ftz.f32 	%f726, %f723, %f274;
	add.ftz.f32 	%f727, %f724, %f273;
	.loc 1 24 1
	add.ftz.f32 	%f728, %f725, %f281;
	add.ftz.f32 	%f729, %f726, %f280;
	add.ftz.f32 	%f730, %f727, %f279;
	.loc 1 24 1
	add.ftz.f32 	%f731, %f728, %f287;
	add.ftz.f32 	%f732, %f729, %f286;
	add.ftz.f32 	%f733, %f730, %f285;
	.loc 1 24 1
	add.ftz.f32 	%f734, %f731, %f293;
	add.ftz.f32 	%f735, %f732, %f292;
	add.ftz.f32 	%f736, %f733, %f291;
	.loc 1 24 1
	mul.ftz.f32 	%f737, %f734, 0f3D800000;
	mul.ftz.f32 	%f738, %f735, 0f3D800000;
	mul.ftz.f32 	%f739, %f736, 0f3D800000;
	.loc 1 24 1
	sub.ftz.f32 	%f740, %f737, %f203;
	sub.ftz.f32 	%f741, %f738, %f202;
	sub.ftz.f32 	%f742, %f739, %f201;
	.loc 1 24 1
	mul.ftz.f32 	%f743, %f740, %f740;
	mul.ftz.f32 	%f744, %f741, %f741;
	mul.ftz.f32 	%f745, %f742, %f742;
	.loc 1 24 1
	sub.ftz.f32 	%f746, %f737, %f209;
	sub.ftz.f32 	%f747, %f738, %f208;
	sub.ftz.f32 	%f748, %f739, %f207;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f749, %f746, %f746, %f743;
	fma.rn.ftz.f32 	%f750, %f747, %f747, %f744;
	fma.rn.ftz.f32 	%f751, %f748, %f748, %f745;
	.loc 1 24 1
	sub.ftz.f32 	%f752, %f737, %f215;
	sub.ftz.f32 	%f753, %f738, %f214;
	sub.ftz.f32 	%f754, %f739, %f213;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f755, %f752, %f752, %f749;
	fma.rn.ftz.f32 	%f756, %f753, %f753, %f750;
	fma.rn.ftz.f32 	%f757, %f754, %f754, %f751;
	.loc 1 24 1
	sub.ftz.f32 	%f758, %f737, %f221;
	sub.ftz.f32 	%f759, %f738, %f220;
	sub.ftz.f32 	%f760, %f739, %f219;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f761, %f758, %f758, %f755;
	fma.rn.ftz.f32 	%f762, %f759, %f759, %f756;
	fma.rn.ftz.f32 	%f763, %f760, %f760, %f757;
	.loc 1 24 1
	sub.ftz.f32 	%f764, %f737, %f227;
	sub.ftz.f32 	%f765, %f738, %f226;
	sub.ftz.f32 	%f766, %f739, %f225;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f767, %f764, %f764, %f761;
	fma.rn.ftz.f32 	%f768, %f765, %f765, %f762;
	fma.rn.ftz.f32 	%f769, %f766, %f766, %f763;
	.loc 1 24 1
	sub.ftz.f32 	%f770, %f737, %f233;
	sub.ftz.f32 	%f771, %f738, %f232;
	sub.ftz.f32 	%f772, %f739, %f231;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f773, %f770, %f770, %f767;
	fma.rn.ftz.f32 	%f774, %f771, %f771, %f768;
	fma.rn.ftz.f32 	%f775, %f772, %f772, %f769;
	.loc 1 24 1
	sub.ftz.f32 	%f776, %f737, %f239;
	sub.ftz.f32 	%f777, %f738, %f238;
	sub.ftz.f32 	%f778, %f739, %f237;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f779, %f776, %f776, %f773;
	fma.rn.ftz.f32 	%f780, %f777, %f777, %f774;
	fma.rn.ftz.f32 	%f781, %f778, %f778, %f775;
	.loc 1 24 1
	sub.ftz.f32 	%f782, %f737, %f245;
	sub.ftz.f32 	%f783, %f738, %f244;
	sub.ftz.f32 	%f784, %f739, %f243;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f785, %f782, %f782, %f779;
	fma.rn.ftz.f32 	%f786, %f783, %f783, %f780;
	fma.rn.ftz.f32 	%f787, %f784, %f784, %f781;
	.loc 1 24 1
	sub.ftz.f32 	%f788, %f737, %f251;
	sub.ftz.f32 	%f789, %f738, %f250;
	sub.ftz.f32 	%f790, %f739, %f249;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f791, %f788, %f788, %f785;
	fma.rn.ftz.f32 	%f792, %f789, %f789, %f786;
	fma.rn.ftz.f32 	%f793, %f790, %f790, %f787;
	.loc 1 24 1
	sub.ftz.f32 	%f794, %f737, %f257;
	sub.ftz.f32 	%f795, %f738, %f256;
	sub.ftz.f32 	%f796, %f739, %f255;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f797, %f794, %f794, %f791;
	fma.rn.ftz.f32 	%f798, %f795, %f795, %f792;
	fma.rn.ftz.f32 	%f799, %f796, %f796, %f793;
	.loc 1 24 1
	sub.ftz.f32 	%f800, %f737, %f263;
	sub.ftz.f32 	%f801, %f738, %f262;
	sub.ftz.f32 	%f802, %f739, %f261;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f803, %f800, %f800, %f797;
	fma.rn.ftz.f32 	%f804, %f801, %f801, %f798;
	fma.rn.ftz.f32 	%f805, %f802, %f802, %f799;
	.loc 1 24 1
	sub.ftz.f32 	%f806, %f737, %f269;
	sub.ftz.f32 	%f807, %f738, %f268;
	sub.ftz.f32 	%f808, %f739, %f267;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f809, %f806, %f806, %f803;
	fma.rn.ftz.f32 	%f810, %f807, %f807, %f804;
	fma.rn.ftz.f32 	%f811, %f808, %f808, %f805;
	.loc 1 24 1
	sub.ftz.f32 	%f812, %f737, %f275;
	sub.ftz.f32 	%f813, %f738, %f274;
	sub.ftz.f32 	%f814, %f739, %f273;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f815, %f812, %f812, %f809;
	fma.rn.ftz.f32 	%f816, %f813, %f813, %f810;
	fma.rn.ftz.f32 	%f817, %f814, %f814, %f811;
	.loc 1 24 1
	sub.ftz.f32 	%f818, %f737, %f281;
	sub.ftz.f32 	%f819, %f738, %f280;
	sub.ftz.f32 	%f820, %f739, %f279;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f821, %f818, %f818, %f815;
	fma.rn.ftz.f32 	%f822, %f819, %f819, %f816;
	fma.rn.ftz.f32 	%f823, %f820, %f820, %f817;
	.loc 1 24 1
	sub.ftz.f32 	%f824, %f737, %f287;
	sub.ftz.f32 	%f825, %f738, %f286;
	sub.ftz.f32 	%f826, %f739, %f285;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f827, %f824, %f824, %f821;
	fma.rn.ftz.f32 	%f828, %f825, %f825, %f822;
	fma.rn.ftz.f32 	%f829, %f826, %f826, %f823;
	.loc 1 24 1
	sub.ftz.f32 	%f830, %f737, %f293;
	sub.ftz.f32 	%f831, %f738, %f292;
	sub.ftz.f32 	%f832, %f739, %f291;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f833, %f830, %f830, %f827;
	fma.rn.ftz.f32 	%f834, %f831, %f831, %f828;
	fma.rn.ftz.f32 	%f835, %f832, %f832, %f829;
	.loc 1 24 1
	mul.ftz.f32 	%f836, %f834, 0f3D800000;
	fma.rn.ftz.f32 	%f837, %f833, 0f3D800000, %f836;
	fma.rn.ftz.f32 	%f838, %f835, 0f3D800000, %f837;
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f297, %f298, %f299, %f300}, [texture0_RECT, {%f373, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f303, %f304, %f305, %f306}, [texture0_RECT, {%f379, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f309, %f310, %f311, %f312}, [texture0_RECT, {%f385, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f315, %f316, %f317, %f318}, [texture0_RECT, {%f391, %f320}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f321, %f322, %f323, %f324}, [texture0_RECT, {%f373, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f327, %f328, %f329, %f330}, [texture0_RECT, {%f379, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f333, %f334, %f335, %f336}, [texture0_RECT, {%f385, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f339, %f340, %f341, %f342}, [texture0_RECT, {%f391, %f344}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f345, %f346, %f347, %f348}, [texture0_RECT, {%f373, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f351, %f352, %f353, %f354}, [texture0_RECT, {%f379, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f357, %f358, %f359, %f360}, [texture0_RECT, {%f385, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f363, %f364, %f365, %f366}, [texture0_RECT, {%f391, %f368}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f369, %f370, %f371, %f372}, [texture0_RECT, {%f373, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f375, %f376, %f377, %f378}, [texture0_RECT, {%f379, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f381, %f382, %f383, %f384}, [texture0_RECT, {%f385, %f392}];
	// inline asm
	.loc 1 24 127
	// inline asm
	tex.2d.v4.f32.f32 {%f387, %f388, %f389, %f390}, [texture0_RECT, {%f391, %f392}];
	// inline asm
	.loc 1 24 1
	add.ftz.f32 	%f839, %f299, %f305;
	add.ftz.f32 	%f840, %f298, %f304;
	add.ftz.f32 	%f841, %f297, %f303;
	.loc 1 24 1
	add.ftz.f32 	%f842, %f839, %f311;
	add.ftz.f32 	%f843, %f840, %f310;
	add.ftz.f32 	%f844, %f841, %f309;
	.loc 1 24 1
	add.ftz.f32 	%f845, %f842, %f317;
	add.ftz.f32 	%f846, %f843, %f316;
	add.ftz.f32 	%f847, %f844, %f315;
	.loc 1 24 1
	add.ftz.f32 	%f848, %f845, %f323;
	add.ftz.f32 	%f849, %f846, %f322;
	add.ftz.f32 	%f850, %f847, %f321;
	.loc 1 24 1
	add.ftz.f32 	%f851, %f848, %f329;
	add.ftz.f32 	%f852, %f849, %f328;
	add.ftz.f32 	%f853, %f850, %f327;
	.loc 1 24 1
	add.ftz.f32 	%f854, %f851, %f335;
	add.ftz.f32 	%f855, %f852, %f334;
	add.ftz.f32 	%f856, %f853, %f333;
	.loc 1 24 1
	add.ftz.f32 	%f857, %f854, %f341;
	add.ftz.f32 	%f858, %f855, %f340;
	add.ftz.f32 	%f859, %f856, %f339;
	.loc 1 24 1
	add.ftz.f32 	%f860, %f857, %f347;
	add.ftz.f32 	%f861, %f858, %f346;
	add.ftz.f32 	%f862, %f859, %f345;
	.loc 1 24 1
	add.ftz.f32 	%f863, %f860, %f353;
	add.ftz.f32 	%f864, %f861, %f352;
	add.ftz.f32 	%f865, %f862, %f351;
	.loc 1 24 1
	add.ftz.f32 	%f866, %f863, %f359;
	add.ftz.f32 	%f867, %f864, %f358;
	add.ftz.f32 	%f868, %f865, %f357;
	.loc 1 24 1
	add.ftz.f32 	%f869, %f866, %f365;
	add.ftz.f32 	%f870, %f867, %f364;
	add.ftz.f32 	%f871, %f868, %f363;
	.loc 1 24 1
	add.ftz.f32 	%f872, %f869, %f371;
	add.ftz.f32 	%f873, %f870, %f370;
	add.ftz.f32 	%f874, %f871, %f369;
	.loc 1 24 1
	add.ftz.f32 	%f875, %f872, %f377;
	add.ftz.f32 	%f876, %f873, %f376;
	add.ftz.f32 	%f877, %f874, %f375;
	.loc 1 24 1
	add.ftz.f32 	%f878, %f875, %f383;
	add.ftz.f32 	%f879, %f876, %f382;
	add.ftz.f32 	%f880, %f877, %f381;
	.loc 1 24 1
	add.ftz.f32 	%f881, %f878, %f389;
	add.ftz.f32 	%f882, %f879, %f388;
	add.ftz.f32 	%f883, %f880, %f387;
	.loc 1 24 1
	mul.ftz.f32 	%f884, %f881, 0f3D800000;
	mul.ftz.f32 	%f885, %f882, 0f3D800000;
	mul.ftz.f32 	%f886, %f883, 0f3D800000;
	.loc 1 24 1
	sub.ftz.f32 	%f887, %f884, %f299;
	sub.ftz.f32 	%f888, %f885, %f298;
	sub.ftz.f32 	%f889, %f886, %f297;
	.loc 1 24 1
	mul.ftz.f32 	%f890, %f887, %f887;
	mul.ftz.f32 	%f891, %f888, %f888;
	mul.ftz.f32 	%f892, %f889, %f889;
	.loc 1 24 1
	sub.ftz.f32 	%f893, %f884, %f305;
	sub.ftz.f32 	%f894, %f885, %f304;
	sub.ftz.f32 	%f895, %f886, %f303;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f896, %f893, %f893, %f890;
	fma.rn.ftz.f32 	%f897, %f894, %f894, %f891;
	fma.rn.ftz.f32 	%f898, %f895, %f895, %f892;
	.loc 1 24 1
	sub.ftz.f32 	%f899, %f884, %f311;
	sub.ftz.f32 	%f900, %f885, %f310;
	sub.ftz.f32 	%f901, %f886, %f309;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f902, %f899, %f899, %f896;
	fma.rn.ftz.f32 	%f903, %f900, %f900, %f897;
	fma.rn.ftz.f32 	%f904, %f901, %f901, %f898;
	.loc 1 24 1
	sub.ftz.f32 	%f905, %f884, %f317;
	sub.ftz.f32 	%f906, %f885, %f316;
	sub.ftz.f32 	%f907, %f886, %f315;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f908, %f905, %f905, %f902;
	fma.rn.ftz.f32 	%f909, %f906, %f906, %f903;
	fma.rn.ftz.f32 	%f910, %f907, %f907, %f904;
	.loc 1 24 1
	sub.ftz.f32 	%f911, %f884, %f323;
	sub.ftz.f32 	%f912, %f885, %f322;
	sub.ftz.f32 	%f913, %f886, %f321;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f914, %f911, %f911, %f908;
	fma.rn.ftz.f32 	%f915, %f912, %f912, %f909;
	fma.rn.ftz.f32 	%f916, %f913, %f913, %f910;
	.loc 1 24 1
	sub.ftz.f32 	%f917, %f884, %f329;
	sub.ftz.f32 	%f918, %f885, %f328;
	sub.ftz.f32 	%f919, %f886, %f327;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f920, %f917, %f917, %f914;
	fma.rn.ftz.f32 	%f921, %f918, %f918, %f915;
	fma.rn.ftz.f32 	%f922, %f919, %f919, %f916;
	.loc 1 24 1
	sub.ftz.f32 	%f923, %f884, %f335;
	sub.ftz.f32 	%f924, %f885, %f334;
	sub.ftz.f32 	%f925, %f886, %f333;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f926, %f923, %f923, %f920;
	fma.rn.ftz.f32 	%f927, %f924, %f924, %f921;
	fma.rn.ftz.f32 	%f928, %f925, %f925, %f922;
	.loc 1 24 1
	sub.ftz.f32 	%f929, %f884, %f341;
	sub.ftz.f32 	%f930, %f885, %f340;
	sub.ftz.f32 	%f931, %f886, %f339;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f932, %f929, %f929, %f926;
	fma.rn.ftz.f32 	%f933, %f930, %f930, %f927;
	fma.rn.ftz.f32 	%f934, %f931, %f931, %f928;
	.loc 1 24 1
	sub.ftz.f32 	%f935, %f884, %f347;
	sub.ftz.f32 	%f936, %f885, %f346;
	sub.ftz.f32 	%f937, %f886, %f345;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f938, %f935, %f935, %f932;
	fma.rn.ftz.f32 	%f939, %f936, %f936, %f933;
	fma.rn.ftz.f32 	%f940, %f937, %f937, %f934;
	.loc 1 24 1
	sub.ftz.f32 	%f941, %f884, %f353;
	sub.ftz.f32 	%f942, %f885, %f352;
	sub.ftz.f32 	%f943, %f886, %f351;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f944, %f941, %f941, %f938;
	fma.rn.ftz.f32 	%f945, %f942, %f942, %f939;
	fma.rn.ftz.f32 	%f946, %f943, %f943, %f940;
	.loc 1 24 1
	sub.ftz.f32 	%f947, %f884, %f359;
	sub.ftz.f32 	%f948, %f885, %f358;
	sub.ftz.f32 	%f949, %f886, %f357;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f950, %f947, %f947, %f944;
	fma.rn.ftz.f32 	%f951, %f948, %f948, %f945;
	fma.rn.ftz.f32 	%f952, %f949, %f949, %f946;
	.loc 1 24 1
	sub.ftz.f32 	%f953, %f884, %f365;
	sub.ftz.f32 	%f954, %f885, %f364;
	sub.ftz.f32 	%f955, %f886, %f363;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f956, %f953, %f953, %f950;
	fma.rn.ftz.f32 	%f957, %f954, %f954, %f951;
	fma.rn.ftz.f32 	%f958, %f955, %f955, %f952;
	.loc 1 24 1
	sub.ftz.f32 	%f959, %f884, %f371;
	sub.ftz.f32 	%f960, %f885, %f370;
	sub.ftz.f32 	%f961, %f886, %f369;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f962, %f959, %f959, %f956;
	fma.rn.ftz.f32 	%f963, %f960, %f960, %f957;
	fma.rn.ftz.f32 	%f964, %f961, %f961, %f958;
	.loc 1 24 1
	sub.ftz.f32 	%f965, %f884, %f377;
	sub.ftz.f32 	%f966, %f885, %f376;
	sub.ftz.f32 	%f967, %f886, %f375;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f968, %f965, %f965, %f962;
	fma.rn.ftz.f32 	%f969, %f966, %f966, %f963;
	fma.rn.ftz.f32 	%f970, %f967, %f967, %f964;
	.loc 1 24 1
	sub.ftz.f32 	%f971, %f884, %f383;
	sub.ftz.f32 	%f972, %f885, %f382;
	sub.ftz.f32 	%f973, %f886, %f381;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f974, %f971, %f971, %f968;
	fma.rn.ftz.f32 	%f975, %f972, %f972, %f969;
	fma.rn.ftz.f32 	%f976, %f973, %f973, %f970;
	.loc 1 24 1
	sub.ftz.f32 	%f977, %f884, %f389;
	sub.ftz.f32 	%f978, %f885, %f388;
	sub.ftz.f32 	%f979, %f886, %f387;
	.loc 1 24 1
	fma.rn.ftz.f32 	%f980, %f977, %f977, %f974;
	fma.rn.ftz.f32 	%f981, %f978, %f978, %f975;
	fma.rn.ftz.f32 	%f982, %f979, %f979, %f976;
	.loc 1 24 1
	mul.ftz.f32 	%f983, %f981, 0f3D800000;
	fma.rn.ftz.f32 	%f984, %f980, 0f3D800000, %f983;
	fma.rn.ftz.f32 	%f985, %f982, 0f3D800000, %f984;
	setp.lt.ftz.f32	%p4, %f544, %f691;
	selp.f32	%f986, 0f3F800000, 0f00000000, %p4;
	.loc 1 24 1
	sub.ftz.f32 	%f987, %f397, %f986;
	mul.ftz.f32 	%f988, %f987, %f590;
	fma.rn.ftz.f32 	%f989, %f986, %f443, %f988;
	mul.ftz.f32 	%f990, %f987, %f591;
	fma.rn.ftz.f32 	%f991, %f986, %f444, %f990;
	mul.ftz.f32 	%f992, %f987, %f592;
	fma.rn.ftz.f32 	%f993, %f986, %f445, %f992;
	mul.ftz.f32 	%f994, %f987, %f691;
	fma.rn.ftz.f32 	%f995, %f986, %f544, %f994;
	.loc 1 24 1
	setp.lt.ftz.f32	%p5, %f985, %f838;
	selp.f32	%f996, 0f3F800000, 0f00000000, %p5;
	.loc 1 24 1
	sub.ftz.f32 	%f997, %f397, %f996;
	mul.ftz.f32 	%f998, %f997, %f737;
	fma.rn.ftz.f32 	%f999, %f996, %f884, %f998;
	mul.ftz.f32 	%f1000, %f997, %f738;
	fma.rn.ftz.f32 	%f1001, %f996, %f885, %f1000;
	mul.ftz.f32 	%f1002, %f997, %f739;
	fma.rn.ftz.f32 	%f1003, %f996, %f886, %f1002;
	mul.ftz.f32 	%f1004, %f997, %f838;
	fma.rn.ftz.f32 	%f1005, %f996, %f985, %f1004;
	.loc 1 24 1
	setp.lt.ftz.f32	%p6, %f1005, %f995;
	selp.f32	%f1006, 0f3F800000, 0f00000000, %p6;
	.loc 1 24 1
	sub.ftz.f32 	%f1007, %f397, %f1006;
	mul.ftz.f32 	%f1008, %f1007, %f989;
	fma.rn.ftz.f32 	%f2, %f1006, %f999, %f1008;
	mul.ftz.f32 	%f1009, %f1007, %f991;
	fma.rn.ftz.f32 	%f3, %f1006, %f1001, %f1009;
	mul.ftz.f32 	%f1010, %f1007, %f993;
	fma.rn.ftz.f32 	%f4, %f1006, %f1003, %f1010;
	.loc 1 24 1
	mad.lo.s32 	%r3, %r2, %r4, %r1;
	.loc 1 24 1
	setp.eq.s32	%p7, %r5, 0;
	@%p7 bra 	BB0_3;

	mul.wide.s32 	%rd131, %r3, 16;
	add.s64 	%rd132, %rd1, %rd131;
	.loc 1 24 1
	st.global.v4.f32 	[%rd132], {%f4, %f3, %f2, %f318};
	bra.uni 	BB0_4;

BB0_3:
	mul.wide.s32 	%rd133, %r3, 8;
	add.s64 	%rd134, %rd1, %rd133;
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f4;
	mov.b16 	%rs1, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f3;
	mov.b16 	%rs2, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f2;
	mov.b16 	%rs3, %temp;
}
	.loc 2 3513 10
	{
	.reg .b16 %temp;
	cvt.rn.ftz.f16.f32 	%temp, %f318;
	mov.b16 	%rs4, %temp;
}
	.loc 1 24 251
	st.global.v4.u16 	[%rd134], {%rs1, %rs2, %rs3, %rs4};

BB0_4:
	.loc 1 24 2
	ret;
}


